본문 바로가기

카피킬러 HR 이야기

인공지능 기술 기업 무하유가 AI채용을 위해 학습데이터를 구축하는 방법

인공지능 기술이 다양한 산업에 적용되고 있는 만큼, 인공지능을 학습시키기 위한 기술도 다양해지고 있는데요. 국내 유일의 표절검사 서비스를 제공하고 AI채용 채용 서류 검토도 진행 중인 인공지능 기술기업 무하유에서는 어떤 방법으로 인공지능을 학습시키고 있을까요?


무하유에서는 자체 개발한 데이터 라벨링 시스템 AIDA를 활용하고 있습니다. AIDA는 AI DATA의 약자로 AI채용의 서류평가 서비스 카피킬러HR에서 아주 중요한 역할을 하고 있는데요. 이 인공지능 데이터 라벨링 시스템으로 무하유만의 한국어 인공지능 학습데이터 구축이 가능했습니다.

 

 


무하유의 한국어 인공지능 학습데이터

 

무하유는 10년 간 AI 기반의 자연어 (텍스트) 처리 기술을 개발하고 있습니다. 어순, 문맥, 상황에 따라 의미가 달라지는 한국어에 특화된 태깅과 라벨링이 필요하여 무하유에서 자체적으로 학습 데이터를 구축해야 했습니다. 국내 다른 데이터 라벨링 기업들은 텍스트가 아닌 이미지나 동영상 데이터 구축에 집중하고 있기 때문입니다.

 

 


▼ 학습데이터가 AI채용에 미치는 영향

 

무하유에서 제공하는 AI채용 서비스 카피킬러HR은 크게 5가지 검사가 가능합니다.
1. 기본검사
자기소개서 내용 중 글자수 위반, 맞춤법, 비속어, 인적사항, 기업명 오기재, 반복 단어/문장 등의 감점 요소를 탐지
2. 표절검사
자기소개서의 표절 여부를 통해 지원자의 성실성/윤리성 점검
3. 직무 적합도
지원자의 직무 적합성 판단을 위해 채용 공고의 직무기술서 또는 NCS 직무기술서, 고성과자의 데이터(기업에서 제공 시) 등과 자기소개서의 연관도를 분석
4. AI평가
인사 전문가 수준의 심층 분석 및 평가를 인공지능이 진행하여 평가 시 유용한 근거 제시
5. 블라인드 체커
블라인드 채용을 위해 문맥을 유추하여 출신대학, 가족직업 등을 추출하여 편견 요소를 정확하게 마스킹

 


한국어 인공지능 학습데이터가 카피킬러HR에서 어떻게 사용되는지 예시로 확인해보겠습니다.
동일한 단어가 자기소개서에서 부모님의 직업으로 작성됐을수도, 본인의 경험, 혹은 희망 사항을 위해 작성되었을 수도 있습니다. 

A: 어려서부터 억울한 사연의 사람들을 도와주는 변호사생활을 오래 하셨던 아버지를 보며 법무법인 가나다에서 훌륭한 변호사로 활동하고싶다고 생각했습니다.
B: 어린 시절 잘못된 계약서 작성으로 아버지가 직장을 잃었던 적이 있습니다. 하지만 우연히 알게된 인권 변호사의 도움으로 다시 복직하실 수 있었고 그때부터 저도 법무법인 가나다에서 사람들을 도울 수 있는 변호사가 되고 싶었습니다.

두 문장 모두 변호사와 아버지 라는 단어가 들어갔고 변호사가 되고 싶다는 내용이지만 그 이유가 다릅니다. A문장은 변호사인 아버지로 인해 변호사가 되고 싶어졌고, 자기소개서에 아버지의 직업을 작성했습니다. B문장은 아버지가 힘드셨을 때 도와준 변호사로 인해 변호사의 꿈을 가지게 되었다는 내용으로 편견 요소가 작성되지 않았습니다. 
만약 문맥을 이해하지 않고 변호사와 아버지란 단어를 모두 마스킹 처리한다면 B문장의 작성자는 지원 계기가 명확하게 어필되지 않았겠죠?
이처럼 동일한 단어라도 문맥에 따라 다르게 사용되는 경우 인공지능이 스스로 파악할 수 있도록 올바른 한국어 학습데이터를 구축하고 있습니다.

 

 


AIDA를 관리하는 언어지능 유닛

 

인공지능에 학습데이터를 구축하고, 데이터가 올바른지 확인은 누가 할까요? 무하유에서는 AIDA를 전문적으로 관리하는 언어지능 유닛이 있습니다. 언어지능 유닛은 자연어를 라벨링화하는 작업만을 전담하여 한국어의 특성에 대한 기준과 예외 상황을 수집 및 정리하고 라벨링 작업자들을 교육하는 역할을 합니다. 라벨러들이 작업한 학습데이터가 딥러닝 모델에 제대로 학습되었는지 검수하고 판단하는 역할도 하고 있습니다.

무하유는 한국어 학습데이터의 중요성을 알고 있기에 전담 유닛을 운영하고 전문 라벨링 작업자를 모집하고 교육, 양성하고 있습니다. 라벨링 작업자는 일정 교육 기간을 거쳐 수차례의 실습과 테스트를 통해 선발하고 있습니다. 검증된 인력을 활용함으로 인해 시간과 비용이 투자되지만 정확한 데이터를 위한 노력입니다.

 


👇 데이터 라벨링 선정 방법

 

무하유의 AI 학습데이터 관리 시스템, AIDA를 소개합니다.

​AIDA는 AI DATA의 약자로, 인공지능(AI)의 학습을 위한 테스트 데이터 라벨링 작업을 위해 ...

blog.naver.com

 


 

AI채용 전형을 고려 중이시라면 문맥을 이해하여 인사담당자의 서류 검토를 도와줄 인공지능 서비스, 카피킬러HR 담당자와 상담을 통해 우리 기업에 딱 맞는 서비스를 이용해보세요.


👇 도입문의 

 

카피킬러HR: 도입문의

도입문의 아래 양식을 기입해 주세요. 빠르게 답변 드리겠습니다.

www.hr.copykiller.com