EMR(2)
-
병원차트 OCR 전처리 코드 공유 (OpenCV)
지난 번 pytesseract로 휴대폰으로 촬영한 병원차트 OCR을 시도해 본 결과, foundation model로는 인식 성능이 매우 나쁘게 나와서 fine tuning을 시도해 보았다. 그러나, 이미지 퀄리티가 너무 안 좋아서 bounding box도 못 잡길래, 병원 측에 이미지 촬영본 말고 캡처본으로 다시 데이터를 달라고 요청드렸다. 기존 데이터는 이렇게 생겼다. (개인정보는 모두 블러 처리했다.) 위아래, 양옆으로 잘린 글씨 및 불규칙한 촬영 각도로 인해 전처리도 까다로웠고 bbox 잡는 것도 어려웠다. 새로운 데이터는 위와 같이 차트 전체 모습이 캡쳐된 형태여서 훨씬 규칙적이었다. 이 이미지 332장, 총 8,567명의 환자 데이터를 OCR하는 task를 수행하기 위해 전처리를 아래와 같이..
2024.05.03 -
한국 의료기기 시장에 관한 인사이트 1편: 의료정보시스템 (feat. KIMES 2024)
한국 의료기기 시장에 대한 전반적인 의견 KIMES 2024를 다녀왔다. 코엑스 전시장 A~E 홀 전체를 대관하여 총 850개의 업체가 참여했다. 오전 10시 30분 정도에 도착해서 오후 6시까지 약 7시간 가량을 쉴새없이 돌아다녔는데, 한 30%도 제대로 못 본 것 같다. 느꼈던 점은, 한국 의료 시장은 엄청난 각축장이자 레드오션이라는 것이다. 지불 용의가 한정된 병원에게 제품을 팔기 위해 한정된 파이 안에서 땅따먹기를 하고 있는 느낌이 강했다. 2022년 한 해 기준 한국 의료시장 전체 규모는 약 11.9조 원이었다. 대략 12조 원이라고 치자. 2023년 자료는 아직 나오지 않았지만, 연평균 성장률을 적용해 보면 13~14조원 정도 될 것 같다. 이게 어느 정도 규모냐, 2022년 사교육 시장 규모..
2024.03.17