본문 바로가기

카피킬러HR 프리즘 이야기

인공지능이 채용서류, 자기소개서를 분석을 한다. 어떻게 가능한걸까?

 

이세돌과 알파고의 대결 이후, 우리나라에서는 인공지능이 사회 곳곳에서 화두 되고 수많은 기업들이 인공지능에 뛰어들었습니다. 

한국무역협회가 2018년 1월 발간한 '우리 기업의 인공지능(AI)을 활용한 비즈니스 모델'에는 국내 인공지능 산업의 발전 수준은 미국과 2.2년 정도의 기술 격차를 보이고 있으며, 아직까지 초기 단계에 머물고 있다고 분석하고 있습니다. 

현재 우리나라는 단순 상담, 상품 안내 등의 특정 서비스 사업에만 한정되어 인공지능이 도입된 상태이며, 최근 오픈 소스 정책으로 알고리즘 접근이 용이해졌지만 인공지능 기술의 저변이 되는 빅데이터 구축은 일부 대기업에 한정되어 있다고 하는데요. 기반 데이터를 확보하는 것이 인공지능 활용의 성패를 좌우하는 주요인이라고 합니다. 

표절검사서비스 전문기업 (주)무하유도 2017년 하반기부터 인공지능을 활용한 채용서류 분석서비스 카피킬러HR 프리즘 연구개발에 집중해왔으며, 2018년 상반기 롯데그룹 채용시스템에 (주)무하유의 기술력이 투입되었습니다.무하유에서는 어떤 인공지능을 활용하고 있으며, 표절검사 서비스 전문 기업에서 시작한 무하유가 어떻게 인공지능을 활용한 채용서류 분석 서비스를 개발하게 되었는지 사용자 여러분의 입장에서 궁금해 하실 수 있는 몇가지 질문을 무하유의 대표이사이자 전문 개발자인 신동호 프로의 답변을 통해 자세히 알아보고자 합니다. 

 

 

 

Q. 표절 분석을 전문으로 하던 기업이 어떻게 인공지능, 채용 서류 분석을 시작하게 되었나요? 

 

저는 대학원에서 인공지능을 전공했습니다. 하지만 그 당시 인공지능은 금기어나 마찬가지였어요.상상 속에서나 나올 법한 이야기로 비쳤던 것 같아요. 그래서 개발 현업에 종사하면서는 잠시 뒤편에 인공지능을 미뤄둔 상태였죠. 

그런데 시기적으로 잘 맞는 때가 왔습니다. 구글이 텐서플로우를 오픈소스로 공개하면서 조금은 더 쉽게 인공지능 관련 연구개발을 할 수 있게 되었습니다. 또한 채용시장이라는 곳이 인공지능에서 기반이 되는 충분한 데이터를 확보하기 쉬운 곳이었어요. 

 

 

 

카피킬러가 이미 지난 7년간의 서비스를 통해서 50억 건 이상의 데이터를 확보한 것에 더해서 입사지원자들이 스스로 자기소개서라는 데이터를 제출하는 시스템이기 때문에 (대기업의 경우) 최소 10만 건 이상의 데이터를 확보할 수 있게 된 거죠. 

 

Q. 요즘은 인공지능을 활용하지 않는 기업이 없다고 느낄 정도로 인공지능 이야기가 많이 나오고 있는데요. 소비자 입장에서는 크게 와닿지 않는 부분도 있습니다. 카피킬러 HR 프리즘에 사용된 인공지능은 어떻게 다른가요? 

 

아마 여러분이 가장 쉽게 인공지능을 접할 수 있는 분야가 챗봇 서비스가 아닐까 싶은데요. 네이버가 챗봇을 활용해서 실시간으로 쇼핑 문의에 답변해주는 서비스를 시작했다가 실패한 사례가 있습니다. 

인간의 자연어를 기계가 완전히 이해하고 정확한 답변을 주는 것은 굉장히 어렵습니다. 그래서 네이버도 챗봇이 답변해야 하는 주제를 좁혀서 비교적 패턴이 쉬운 치킨 배달 서비스만 제한적으로 적용해서 이전보다 만족도 높은 결과를 만들었다고 하는데요. 

무하유는 카피킬러 표절 분야에서 연구개발을 해오면서 자연어 처리에 강점을 갖게 되었습니다. 다만, 모든 분야의 문서에 있는 자연어 처리에 인공지능을 활용한다면 정확도가 떨어질 수밖에 없죠. 그래서 직무와 관련된 용어, 사람의 성향을 나타내는 용어들이 주로 쓰이는 채용, 자기소개서라는 제한된 분야에만 적용을 했습니다. 

결과적으로 내부적으로 테스트했던 합불예측과 실제 결과가 85% 정도 수준으로 일치하는 것을 확인했습니다. 만약 자기소개서 이외에 모든 분야에서 인공지능을 활용해서 결과를 보이라고 한다면 저로서도 불가능했을 것 같습니다. 

 

Q. 카피킬러HR 프리즘에 구체적으로 어떻게 인공지능을 사용하셨나요? 

 

자연어 처리에 집중했습니다. 언어 처리를 하는 방식은 두 가지가 있습니다. 기호 주의에 의한 방식, 연결주의에 의한 방식. 그동안은 주로 기호 주의 방식을 사용해왔어요. 왜냐면 언어라는 것이 문법에 의한 것이고, 정해진 규칙이 적용되는 것이기 때문에 각각의 상징성을 분석하는 기호 주의를 사용하는 것이 일반적이었죠. 반면에 연결주의에서는 '학교를 간다, 학교를 안 간다'를 비슷하게 판단하기 때문에 언어 처리에 활용하기가 쉽지 않았어요. 그런데 지금은 기술이 많이 발달하기도 했고, 100% 연결주의는 아닐지라도 기호 주의의 부족한 부분을 보완할 수 있는 정도까지 활용할 수 있게 되었습니다. 

또한, 코퍼스(말뭉치) 분석이 인공지능에 자연어 처리를 하는데 굉장히 중요합니다. 자연어 처리의 가장 기본이 되는 단위가 코퍼스인데요. 문맥에 따라서 어절이 쓰이는 방식이나 의미가 달라질 수 있는데 이것을 이해하고, "'A 문맥'에서는 '가'라는 뜻으로, 'B 문맥'에서는 '나'라는 뜻으로 쓰이는구나"라는 여러 가지 경우의 수를 파악할 수 있는 겁니다. 

카피킬러는 검사 문서가 유입되면 이를 문장단위로 분할하고, 또다시 문장 안에 있는 어절들을 하나씩 분석하는 기술이 있기 때문에 코퍼스 분석에 강점이 있습니다. 더구나 50억 건 이상의 데이터가 있으니, 그 안에서 '어머니'라는 단어가 문장별로 어떻게 쓰였는지를 분석할 수 있다면 대부분의 경우를 파악할 수 있지 않을까요? 사람이 모든 경우의 수를 분석한다면 오랜 시간이 걸리겠지만 딥러닝을 쓰면서 기계가 알아서 규칙을 생성하기 때문에 훨씬 효율적일 수 있는 것이죠. 

 

 

 

Q. 표절분성을 위한 데이터가 60억건이라면 HR뿐 아니라 표절 분석에도 인공지능 활용이 가능할거 같은데, 어떻게 생각하시나요?

 

물론 충분한 데이터가 있으니 인공지능을 활용할 수는 있겠죠. 실제로 고객사 중에서는 문장 표현이 아닌 의미상의 유사성을 분석할 수 있는 서비스를 개발해달라는 요청이 종종 있습니다. 그렇게 하기 위해서는 정말 인공지능이 활용되어야 하는데요. 

저희 내부적으로는 계속 연구하고 테스트 중이었지만 상용화할 수 없었던 이유 중 하나가 인공지능은 이유를 설명할 수 없기 때문이었어요. 표절은 굉장히 민감한 분야입니다. 최대한 객관적이고 공정해야 하는 분야인데 인공지능의 분석의 결과만을 보여줄 뿐 이유를 설명할 수 없어요. 

카피킬러HR 프리즘을 사용한 고객사에서도 개발자들은 카피킬러HR 프리즘이 보여준 결과를 믿지만 인사팀이나 실무를 담당하는 분들은 의구심을 갖죠. "왜 이런 결과가 나왔나요?" 이런 부분이 카피킬러 HR의 한계점, 보완점이라고 생각하기도 하는데요. 

이세돌과 알파고의 대결처럼 이긴다, 진다와 같이 목표가 명확한 경우는 의문을 가지지 않겠지만 표절 분석은 목표가 명확하지 않습니다. 사람이 표절 여부를 분석하더라도 그 결과가 O, X로 나오지 않고 여러 가지 전제가 따라올 수 있기 때문에 인공지능을 활용하기에는 아직 시기적으로 적절하지 않은 것 같습니다.

 

Q. 인공지능을 활용하다 보면 100% 인사담당자의 역할을 대신하는 것도 가능하게 될까요? 서류전형은 사람이 검토하지 않고 카피킬러HR 프리즘의 합격 불합격을 담당하는거죠

 

인공지능이 서류검토의 모든 것을 대신한다? 불가능합니다. 

카피킬러HR 프리즘에서 사용하는 인공지능은 단지 사람이 하기에는 너무 시간과 노력이 많이 들어가는 일을 대신해주어서 다른 중요한 업무에 더욱 집중할 수 있도록 도와주는 것입니다. 그동안 인사담당자들은 유능한 인재를 뽑기 위해서 각종 자격증을 갖춘 사람이 지원하기를 바라왔습니다. 그런데 그런 스펙을 갖춘 지원자가 아무리 많더라도 제대로 읽고 파악하지 못한다면 누가 정말 우리 회사에 맞는 인재인지를 구분할 수 없어요. 

인사담당자가 정말 읽고 분류해낼 수 있을 정도로만 인공지능이 업무를 대신해줘도 채용절차가 훨씬 효율적이지 않을까요? 카피킬러HR 프리즘의 역할은 거기까지입니다. 

 


 

카피킬러HR 프리즘에 사용되는 인공지능 기술에 대해서 알아보는 시간을 가졌습니다. '인공지능'이라는 기술이 실제 어떻게 활용되고 결과를 보여주는지 이해하는데 도움이 되셨으면 좋겠습니다.