사람을 만나다: TTA(한국정보통신기술협회) 한기정 책임연구원님 인터뷰
2022-11-22
오늘 SPH가 만나볼 분은 TTA(한국정보통신기술협회)의 한기정 책임님입니다. TTA는 21년 SPH에서 다루고 있는 협업툴 먼데이닷컴으로 먼저 인연이 닿게 되었고 SuperMap의 고객이 되셨습니다. 그만큼 저희 SPH와 귀한 인연💙을 자랑하고 계시는데요, 감사하게도 흔쾌히 인터뷰에 응해주셔서 저희 SPH 마케팅팀이 TTA로 달려갔습니다!
TTA는 크게 ICT 표준화, 정보통신 시험인증, AI 디지털 융합시험, 소프트웨어 시험인증, TTA 아카데미와 같이 다양한 업무를 수행하고 있습니다. 그럼 책임님은 TTA에서 정확히 어떤 업무를 하시는지, 어떻게 슈퍼맵(SuperMap)을 사용하고 있으신지 저와 함께 책임님의 스토리를 들어보실까요? 👂
(인터뷰 중 검증 실무를 맡으신 김지은 선임님이 중간중간 대답해주신 부분이 있으며 편의상 H, K로 표기하였습니다)
안녕하세요, 한기정 책임님! 간단하게 TTA에서 책임님은 어떤 업무를 하고 있으신지 소개 부탁드립니다.
H: 안녕하세요, 저는 TTA에서 올해 22년도는 인공지능 학습용 데이터 사업의 자율주행/교통/제조 분야의 품질 검증을 담당하고 있습니다.
TTA 홈페이지를 방문해보시면 아시겠지만, TTA가 검증 업무만을 하는 것은 아닙니다. TTA는 표준화, 정보통신, 소프트웨어, AI 융합 데이터 등을 진행하고 있으며 국가사업인 디지털 뉴딜 사업 중 인공지능 학습용 구축사업의 품질 검증 부분 - 22년 올해는 310종 산업 및 기술 관련 AI 학습용 데이터 사업에서 품질 검증 분야가 생각보다 많습니다.
SPH와 관련이 깊은 GIS 정보 분야뿐만 아니라, 자연어, 농축산, 교통, 자율주행, 제조, 관광 등 다양한 부분에서 인공지능 학습용 데이터의 역할 또는 신뢰할 수 있는 데이터인지 품질을 검증한다고 보시면 됩니다.
앗, 듣다 보니 이번에 진행하신 AI 데이터 사업에 대해 궁금한데요, 더 자세히 설명해주실 수 있을까요?
H: 저희가 진행한 부분은 AI 데이터 중에서도 특정하게 학습용 데이터 검증입니다. AI 학습용 데이터의 다양성, 구문적 정확성, 의미적 정확성, 유효성 등 다양한 항목을 검증하고 있는데, 학습된 AI 모델의 성능 및 유효성을 보고 서비스 모델에 대해서 과연 신뢰할 수 있을지, 유효(valid)한 데이터인지 객관적인 검토를 하고 있습니다.
NIA(한국지능정보사회진흥원)에서 주관하고 있는 이 사업은 대한민국에서 구축되고 수집된 AI 학습용 데이터 사업으로, AI 허브라는 곳에 구축이 완료된 데이터 중 검증이 완료된 데이터를 공개하고 있습니다.
실제로 AI 허브를 방문하시면 20년부터 TTA에서 검증한 다양한 데이터가 올라와 있는 것을 확인하실 수 있습니다.
아하! 그럼 이런 검증 과정을 거치고 나면 유저(user) 입장에서는 어떤 점을 기대할 수 있을까요?
H: 객관적으로 제3의 누군가가 이 데이터를 의미 있는 데이터로 읽고 사용할 수 있는가를 검증하는 것이 메인 목적으로, 검증이 완료됐다는 자체로 이미 데이터에 대한 객관성은 확인이 됐다고 볼 수 있습니다.
물론 데이터마다 품질 차이, 오류, 안정성, 신뢰성 등의 편차는 존재할 수 있습니다. 데이터의 다양성은 무궁무진하여 일률적으로 절대적인 평가를 하는 것은 어렵지만 이러한 검증 과정이 끝나고 나면 향후 R&D 및 테스트, 백데이터로 활용할 수 있는 시작 포인트가 될 수 있습니다. 이 사업의 취지는 국내 상황에 맞는 데이터가 AI 분야에서 부족하므로 충분한 학습용 데이터를 구축하고 제공하는 것을 목적으로 시작되었다고 알고 있고 굉장히 의미가 깊다고 생각합니다.
생각보다 훨씬 규모도 크고 의미가 깊은 사업이었군요! 그럼 그중에서도 이번에 SPH와 함께 진행하신 토지피복지도(Land Cover Map), 임상도(Stock Map), 스펙트럼도(Spectrogram) 라벨링 검증 작업은 어떤 내용인가요?
H: TTA는 방금 말씀하신 세 가지 라벨이 붙은 지리 정보 데이터를 검증하는 역할을 했고, 사실 저는 데이터 검증 실무자는 아니었습니다. 좀 전 말씀드렸던 것처럼 TTA에서 다루는 데이터가 다양하다 보니 다양한 데이터 특성, 이를테면 GIS 지리 정보 시스템 데이터를 다뤄야 하는 경우가 생기고 처음에는 이런 특수 데이터를 해석하는 데 어려움이 많았습니다.
아무래도 데이터를 학습시키는 게 단순히 데이터를 다루는 것보다 난이도가 높고 데이터 특수성이 많이 반영되는데 실질적으로 이 부분에 관하여 경험이 있는 국내 업체가 많지 않고 저 역시 어려움이 있었습니다.
앞에서 말한 데이터가 Outdated된 데이터가 아니고 의미 있게 쓸 수 있는 부분에 대한 검증, 제한성, 충분성과 같은 부분에 대한 작업을 거쳤고 그런 의미에 있어 꽤 의미 있었다고 생각합니다.
AI Hub를 방문하시면 TTA가 검증한 토지 피복지도 항공 위성 이미지 데이터를 다운로드하실 수 있습니다!
그럼 말씀 주신 검증 업무 중 가장 어려웠던 점이 있다면 어떤 점일까요?
K: 일단 지리 정보 쪽 데이터에 관련 기본 지식이 없다는 점이 컸습니다. 처음 토지 피복이나 산림 이미지도 일반 이미지로 접근하고 그 안의 다양한 맵 정보들을 간과한 상태였는데요, SPH와 컨설팅을 하면서 SuperMap에서 이미지를 어떻게 띄우고 라벨링 되어있는 정보들을 어떻게 시각화할지, 면적, 실질적인 수치를 어떻게 확인할지 등을 고려한 라벨링 검증을 할 수 있었습니다.
H: 저희가 받은 데이터를 열어볼 때 포멧으로 인한 제한성이 있었습니다. 저희가 범용적으로 쓰고 있는 툴에 어떤 데이터를 올렸을 때 어떤 부분이 소실되는지, 어떤 정보가 부족한지 파악하기 어려웠고요. SPH의 컨설팅을 받아 SuperMap으로 확인하면서 즉각적인 분석으로 데이터 간의 차이를 구분할 수 있었고 그 차이의 제한성을 어떻게 풀 수 있을지, 문제 인지를 하고 방법을 제안받고, 외부 구축사와 할 수 있는 접근방식에 대해 도출하는 등 컨설팅을 그 자리에서 즉석에서 받을 수 있던 점이 굉장히 좋았습니다.
먼데이닷컴부터 시작해서 SPH와 TTA는 인연이 참 깊네요! 많고 많은 GIS 컨설팅 업체 중에서도 SPH와의 협업을 다짐하신 계기는 무엇일까요?
H: 저 같은 경우 CAD 쪽 관련 S/W는 이미 경험했었습니다. 개인적으로 GIS는 S/W 자체가 다른 CAD 데이터보다 무겁고, 스펙도 높은 사양에서 설치해야 하고, 제한사항이 많다고 생각했었습니다. 그래서 맵 데이터를 어떻게 검증하는 데 있어 난해함을 느끼던 상황이었고, 어쩌면 검증이 어려울 수도 있겠다고 생각했습니다.
제가 객관적으로 봤을 때 일단 SuperMap은 인터페이스가 매우 가볍고, 데이터 로드할 때 로딩 속도도 빠르다는 점이 매우 놀라웠습니다. 또한, 저처럼 GIS툴 경험이 없이 일반 AI 가공 툴에 익숙한 사람들도 교육받았을 때 쉽게 이해할 수 있었고요. 이렇게 접근성이 좋은 동시에 데이터 변환이나 로드, 지표 핸들링 시 클로이(cloy)되는 부분이 없어 SuperMap의 안정성에 대해서 또 한 번 놀랐습니다.
그럼 SuperMap을 사용하시면서 가장 맘에 드는 feature는 무엇이셨을까요?
H: 앞에서 말씀드린 것처럼 제가 직접적인 데이터 검증 실무자는 아닙니다. 메인 필드가 GIS 쪽도 아니어서 특정 feature만 꼽기는 힘들 것 같아요. 제 총괄 경험에 비추어봤을 때, 당시 구축 데이터의 특정 면적을 잡아 래스터 이미지의 Pixel값을 Vectorizing하는 Vectorizing Region 및 Raster to Vector 기능이 기억에 남습니다. 구축사가 업로드한 래스터 이미지를 벡터라이징(Vectorizing)하여 면적 계산하는 것에 의지한 부분이 많았고, 특별히 개발이 필요하지 않으면서도 CAD 데이터처럼 벡터 정보를 핸들링할 수 있었습니다. 이런 기능은 저희가 보유하던 기존의 검증 툴에서는 이용할 수 없는 부분이었고 국내 잘 알려진 라벨링 플랫폼 전문 용역 검사 진행도 어려웠던 부문- 단순 Raster 데이터가 아닌 QGIS 구축 데이터의 검증 장애를 해결할 수 있어서 굉장히 만족스러웠습니다.
K: 저는 라벨링이 맞는지 검증할 때 컬러차트를 만들어서 체크했던 기능이 기억에 남습니다.
H: 맞아요. 기존의 툴들은 GIS 속성(property), 좌표, CAD 용 데이터에 대한 속성을 입력하고 그걸 가지고 스크립트를 짜는 인터페이스 위주인데 SuperMap은 속성 입력, 라벨링 외에 어노테이션(annotation:주석)이라는 역할이 따로 있습니다.
기존에 저희 검사자 기업에서 따로 프로그래밍해서 학습용 데이터에 쓰는 속성을 뽑아내야 했던 작업을 여기는 화면에서 제공하는 환경에서 간단하게 속성 조작을 통해 관련 정보를 뽑아낼 수 있었고, 융합 데이터를 핸들링하기에도 좋았습니다. 예를 들어 CAD 데이터를 읽었을 때 CAD 데이터에 대한 기능만 제공하는 게 아니라 AI에 필요한 정보도 따로 편집해서 쓸 수 있어 좋았습니다.
인터뷰에 적극적으로 참여해주신 두 분 모두 감사드립니다💙
두 달간의 프로젝트 동안 SPH의 연구진들과 함께 일하면서 느낀 점이 있다면 무엇인가요?
H: 사실 성격이 다른 도메인, 특정 필드에 있는 소프트웨어 업체와 이야기를 할 때 AI를 이해하지 못하는 상황에서는 대화가 잘 안 풀리는 경우가 많습니다. 저만해도 기존 필드 전문가와 얘기하면 CAD, 여기서 나아가면 BIM, 디지털트윈 관련된 쪽으로만 접근하게 되어 한계를 느꼈는데 SPH 같은 경우 약간 백과사전 같은 느낌으로 데이터 관련 컨설팅을 해주셔서 놀랐습니다. 거기다가 저희와 마찬가지로 국가사업에 대한 경험도 많으셔서 국가사업이 가지는 과제성과 제안 사항에 대해서도 충분히 이해를 해주시고 어떻게 추진할 수 있는지 컨설팅해주셔서 많은 도움이 되었습니다.
협력 업체로서 GIS 전문 컨설팅 회사 SPH가 가진 장점이 있다면 무엇일까요?
H: 프로젝트 구축 도중 혹은 방향성이 조금 모호한 상황에서도 어디서 어떻게 접근해야 하는지 컨설팅을 받을 수 있다는 게 큰 장점으로 느껴졌습니다. 그만큼 경험도 많고 다루고 있는 분야가 다양하시고요. 서로 특정 분야에 대한 전문성이 없으면 그 간격을 서로 좁히기 위해 여러 차례의 회의가 필수적인데 SPH와는 그런 시간을 절약할 수 있었고 자연스레 프로젝트 추진력도 높일 수 있었습니다.
프로젝트 내내 SPH 연구진분들께서 워낙 소통을 잘해주셔서 질적으로나 양적으로나 많은 도움이 되었고 이 점이 제가 경험했던 다른 소프트웨어 회사와 비교했을 때 가지는 가장 큰 차별성이라고 느꼈습니다.
자, 이제 마지막 질문입니다! 저희 인터뷰 시리즈의 필수질문! 한기정 책임님에게 SPH란…?✨
H: 조금 전에도 말씀드렸죠? 딕셔너리!📖
TTA처럼 단기간에 다양한 데이터를 검증해야 하는 입장에서는 내부적으로 해결이 안 되는 부분에 있어 외부에서 해답을 찾아야 합니다. 이때 AI 쪽에 다양한 솔루션을 가진 업체를 찾는 데 어려움이 있어요. 데이터별로 각각 다른 곳을 찾아서 컨설팅받고 a,b,c라는 솔루션을 찾아서 연결하는 것보다 효율적으로 SPH에서 토탈서비스처럼 한 번에 물어볼 수 있어 좋았습니다. 이런 곳을 국내에서 찾을 수 있다는 기대가 거의 없었는데 먼데이닷컴과의 인연으로 알게 되어 굉장히 기쁜 마음입니다.
오늘 TTA 한기정 책임님과 함께한 인터뷰, 어떻게 보셨나요? 질문 하나하나 열정적으로 대답해주시는 모습이 저희 SPH 팀에게 큰 감동이었는데요…💙앞으로도 TTA와 SPH가 좋은 인연 오래오래~ 이어가기를 바라는 마음입니다. 오늘 인터뷰에서 SuperMap에 대해 궁금하신 점이 있다면 저희 SPH 팀에게 문의!주시면 감사하겠습니다. 여기에 GIS 전문가의 산업별 맞춤 세미나도 무료!로 진행해드리오니 많은 신청 부탁드립니다.
감사합니다!
SPH는 Google Maps, SuperMap, Maxar Technologies 등 다양한 제품군을 가지고 있으며, 고객의 사례에 꼭 맞는 무료 세미나 및 인적 컨설팅을 제공하고 있습니다. 더욱 자세한 이야기를 나누고 싶으시다면, 여기에서 문의 주시길 바라며, SPH에서 발행하는 GIS / 로케이션인텔리전스 관련 최신 소식을 받아보고 싶으신 분들은 페이스북 페이지 또는 뉴스레터를 구독해주시길 바랍니다