8.1 The Future of Machine Learning
The Future of Machine Learning
기계 학습 없이는 해석 가능한 기계 학습이 있을 수 없습니다. 그러므로 우리는 기계학습이 어디로 향하는지 추측해야 해석가능성에 대해 이야기할 수 있습니다.
기계 학습(또는 “AI”)은 많은 약속과 기대와 관련되어 있습니다. 우선 낙관적이지 않은 관찰부터 시작하겠습니다. 과학은 많은 훌륭한 기계 학습 도구를 개발하지만, 제 경험으로는 그것들을 기존의 과정과 제품에 통합하는 것이 상당히 어렵습니다. 불가능해서가 아니라 단순히 기업과 기관이 따라잡는 데 시간이 걸리기 때문입니다. 현재의 AI 광고의 골드러시 속에서 기업들은 “AI 연구실”, “기계 학습 유닛”을 개설하고 “데이터 과학자들”, “기계 학습 전문가”, “AI 엔지니어들” 등을 채용하고 있지만, 현실은, 제 경험상, 오히려 답답합니다. 종종 기업들은 필요한 형태의 데이터조차 가지고 있지 않고 데이터 과학자들은 몇 달 동안 놀고 있습니다. 때때로 기업들은 미디어 때문에 AI와 데이터 과학에 대한 기대가 너무 높아서 데이터 과학자는 결코 그것을 이행할 수 없습니다. 그리고 종종 아무도 데이터 과학자들을 기존의 구조와 다른 많은 문제들에 통합시키는 방법을 알지 못합니다. 이것이 저의 첫 번째 예측으로 이어집니다.
마신 학습은 느리지만 꾸준히 성장할 것입니다
디지털화가 진전되고 있으며 자동화에 대한 유혹이 끊임없이 증가하고 있습니다. 기계학습 채택의 경로가 느리고 엉성하더라도 기계학습은 과학에서 비즈니스 프로세스, 제품 및 실제 애플리케이션으로 끊임없이 이동하고 있습니다.
저는 우리가 어떤 유형의 문제가 기계 학습 문제로 공식화될 수 있는지 비전문가들에게 더 잘 설명할 필요가 있다고 생각합니다. 저는 기계 학습을 적용하는 대신 보고 및 SQL 쿼리를 통해 Excel 계산이나 전통적인 비즈니스 인텔리전스를 수행하는 고액 데이터 과학자를 많이 알고 있습니다. 하지만 몇몇 회사들은 이미 기계 학습을 성공적으로 사용하고 있습니다. 큰 인터넷 회사들이 선두에 서 있습니다. 우리는 기계 학습을 프로세스와 제품에 통합하고, 사람들을 훈련시키고, 사용하기 쉬운 기계 학습 도구를 개발할 더 나은 방법을 찾아야 합니다. 저는 기계 학습이 훨씬 사용하기 쉬워질 것이라고 믿습니다. 우리는 이미 클라우드 서비스(“서비스로서의 Machine Learning as a Service”)를 통해 머신러닝이 점점 더 쉬워지고 있음을 알 수 있습니다. 단지 몇 가지 유행어를 퍼뜨리기 위해서입니다. 일단 기계 학습이 성숙해졌고, 이 아이가 이미 첫발을 내디뎠습니다. 제 다음 예측은 다음과 같습니다.
마신 학습은 많은 것을 촉진할 것입니다.
“자동화할 수 있는 모든 것은 자동화할 것”이라는 원칙에 기초하여, 가능하면 다음과 같이 결론을 내립니다. 과제들은 예측문제로 만들어질 것이고 기계학습으로 해결될 것입니다. 기계 학습은 자동화의 한 형태이거나 최소한 자동화의 일부가 될 수 있다. 현재 인간에 의해 수행되는 많은 업무들은 기계 학습으로 대체됩니다. 다음은 기계 학습을 사용하여 일부를 자동화하는 작업의 몇 가지 예입니다.
- 문서 정렬/결정/완료(예: 보험 회사, 법률 부문 또는 컨설팅 회사)입니다.
- 신용 애플리케이션과 같은 데이터 중심의 의사결정을 내릴 수 있습니다.
- 마약이 발견되었습니다.
- 조립 라인의 품질 컨트롤입니다.
- 자율주행차입니다.
- 질병의 진단입니다.
- 번역입니다. 이 책에서는 깊은 신경망을 이용한 번역 서비스(DeepL를 이용하여 영어에서 독일어로 번역하고 다시 영어로 번역하여 문장을 향상시켰습니다.
- …
기계 학습의 돌파구는 더 나은 컴퓨터/더 많은 데이터/더 나은 소프트웨어를 통해서만 달성될 수 있습니다.
인쇄성 도구는 기계 학습의 도입을 촉진합니다.
기계학습 모델의 목표는 결코 완벽히 명기할 수 없다는 전제하에, 잘못 표기된 것과 실제 목표 사이의 간격을 좁히기 위해 해석 가능한 기계학습이 필요하다는 것을 따릅니다. 많은 분야와 분야에서 해석성은 기계 학습의 채택을 위한 촉매제가 될 것입니다. 몇 가지 일화적 증거가 있습니다. 제가 이야기한 많은 사람들은 다른 사람들에게 모델을 설명할 수 없기 때문에 기계 학습을 사용하지 않습니다. 저는 해석성이 이 문제를 해결하고 투명성을 요구하는 조직과 사람들에게 기계 학습을 매력적으로 만들 것이라고 믿습니다. 문제의 오식 외에도, 많은 산업은 법적 이유, 위험 회피 또는 기본 작업에 대한 통찰력을 얻기 위해 해석 가능성을 요구합니다. 기계 학습은 모델링 프로세스를 자동화하고 데이터와 기본 작업에서 인간을 좀 더 멀리 이동합니다. 따라서 실험 설계, 교육 배포 선택, 샘플링, 데이터 인코딩, 피쳐 엔지니어링 등의 문제가 발생할 위험이 높아집니다. 해석 도구를 사용하면 이러한 문제를 쉽게 식별할 수 있습니다.