5년 전만해도 머신 러닝(machine learning)은 기업이 인공지능을 활용하는 주요 방식 중 하나였다. 당시 머신러닝은 "모든 산업을 변화시키는 만연하고 강력한 AI의 한 형태"로 통했다.

하지만 2022년 ChatGPT-3.5가 출시된 후, 많은 기업들이 새로운 콘텐츠를 제작하는 데 사용할 수 있는 AI의 하위 분야인 생성형 AI(Generative AI)에 집중하기 시작했다. 생성형 AI도 머신 러닝이다.

기존의 머신러닝은 이제 많은 조직에서 자리 잡은 기술이며, 오늘날 선도 기업들은 생성적 AI의 활용 사례에 집중하고 있다. 2024년 기업 데이터 담당 임원들을 대상으로 한 설문조사에서 응답자의 64%는 생성형 AI가 한 세대에서 가장 혁신적인 기술이 될 잠재력을 가지고 있다고 답했다.

생성형 AI는 널리 접근 가능하고 수많은 새로운 응용 분야를 가지고 있지만, 기존의 머신러닝과 같은 다른 형태의 AI를 도입하는 것이 언제 가장 적합한지 알아야 한다.

MIT대 슬론 경영대학원 소속 AI 전문가, 스와티 굽타(Swati Gupta) 교수와 라마 라마크리슈난 (Rama Ramakrishnan)교수를 통해 생성형 AI가 예측적 머신 러닝을 대체하는 분야, 머신러닝이 여전히 가장 효과적인 도구인 분야, 그리고 기업이 이 기술들을 어떻게 함께 활용하는지에 대해 알아보자.

머신 러닝이란 무엇인가?
머신 러닝은 컴퓨터가 명시적으로 프로그래밍되지 않고도 학습할 수 있도록 하는 인공 지능의 한 유형이다. 기존 컴퓨팅에서는 사람이 기계에 작업 완료를 위한 자세한 지침을 제공하는 프로그램을 만들어야 했지만, 머신 러닝 프로그램은 예시를 통해 학습할 수 있다.

머신 러닝은 고객 행동 예측부터 금융 거래 사기 가능성 평가, 온라인 쇼핑 사이트의 맞춤형 검색 결과 생성까지 다양한 용도로 사용된다.

생성형 AI 도구를 포함한 머신 러닝에 사용되는 데이터는 MS엑셀 (스프레드시트)의 많은 숫자들, 텍스트, 이미지, 오디오(음성) 또는 비디오(영상)일 수 있다. 머신 러닝 모델이 학습하는 데이터가 많을수록 모델의 정확도는 높아진다. 머신 러닝이 작동하려면 애플리케이션(특정 기능을 수행하도록 설계된 소프트웨어 프로그램, 업무시스템을 의미)이 식별하고 분석할 수 있는 데이터 내의 패턴과 규칙이 있어야 한다.

라마크리슈난 교수는 "머신 러닝의 기본 개념은 데이터를 수집하는 것이 이해를 얻는 것보다 훨씬 쉽다는 것이다."라고 말한다. 예를 들어, 머신 러닝 프로그램에 동물 사진 수천 장을 제공하고 그 중 어떤 것이 고양이인지, 어떤 것이 강아지인지 알려주는 것이, 프로그램에 고양이와 개를 구분하는 복잡한 방법을 모두 가르치는 것보다 훨씬 쉽다는 것이다. 라벨이 붙은 데이터를 프로그램에 입력하면, 프로그램은 두 가지를 구분하는 방법을 스스로 학습할 수 있다.

굽타 교수는 머신 러닝이 "다른 방법으로는 발견하지 못했을 패턴을 일반화하는 결정을 내린다."라고 말했습니다. "머신 러닝은 우리가 가지고 있는 데이터와 모델만큼이나 훌륭하다."

따라서 머신 러닝은 고객과의 대화 녹음, 기계의 센서 로그, ATM 거래 내역처럼 수천 또는 수백만 개의 데이터가 있는 상황에 가장 적합하다.

생성형 AI란 무엇인가?
생성형 AI는 대규모 데이터 세트를 기반으로 텍스트, 이미지, 비디오 등 새로운 콘텐츠를 생성할 수 있는 새로운 유형의 머신 러닝이다. 텍스트를 처리하고 생성할 수 있는 AI 프로그램인 대규모 언어 모델(LLM, Large Language Models)은 생성형 AI의 대표적인 유형이다. 생성형 AI의 대표적인 버전인 ChatGPT는 OpenAI에서 2022년에 출시되었으며, 일반 언어로 작성된 사용자 프롬프트에 잘 응답하고 새로운 콘텐츠를 빠르게 생성하는 능력 덕분에 빠르게 성장했다. 일반적으로 사용되고 있는 챗봇 또는 LLM으로는 앤트로픽(Anthropic)의 클로드(Claude), Google의 제미니(Gemini), Microsoft의 코파일럿(Copilot), Meta의 라마(Llama)가 있으며, 모두 지난 2024년 한 해 동안 더욱 정확한 결과를 제공하고 반응성을 높이기 위해 업데이트되었다.

굽타 교수 "머신 러닝은 우리가 보유한 데이터에서 복잡한 상관관계와 패턴을 포착한다. 생성형 AI는 그보다 더 나아간다."라고 말한다. 미세 조정된 특정 생성형 AI 모델은 머신 러닝이 식별할 수 없는 기존 데이터 세트 내의 관계를 식별할 수 있다. 바로 거기에 경쟁력이 있다."라고 굽타 교수는 강조한다.

생성형 AI는 예측을 하거나 패턴을 파악하는 대신 새로운 콘텐츠를 생성한다. 예를 들어 질문에 답하고, 이메일을 작성하고, 아이디어를 브레인스토밍할 수 있다. 굽타 교수는 "요즘 GPT 모델의 활용 사례가 매우 많다. 많은 기업들이 콜센터 통화 내용을 녹취하거나, 정책 문서를 탐색하거나, 신입 직원들이 회사의 기존 소프트웨어 코드를 익히도록 돕는 등 자사 프레임워크 내에서 GPT 모델을 활용할 방법을 모색하고 있다."

그러나 굽타 교수는 생성형 AI 또는 머신러닝을 개발하거나 사용하는 기업들은 부정확성과 편향을 포함한 잠재적인 문제에 주의해야 한다고 경고하고 있다.

https://mitsloan.mit.edu/ideas-made-to-matter/machine-learning-and-generative-ai-what-are-they-good-for

생성형 AI의 최적 활용 사례
새로운 콘텐츠를 생성하는 주요 기능 외에도, 생성형 AI는 기존 머신 러닝이 수행해 오던 작업을 대체하고 있다. 다음과 같이 몇가지 상황을 들 수 있다.

일상적인 언어나 일반적인 이미지를 다룰 때, LLM은 방대한 텍스트나 이미지로 학습되었으며, 기존 솔루션으로 사물을 분류하고 감지하는 데 사용할 수 있습니다. 예를 들어, 기업은 온라인 제품 리뷰를 분석하여 제품 결함에 대한 사용자 신고를 파악하고자 할 수 있습니다. 이는 한때 이러한 리뷰를 식별하도록 훈련된 머신 러닝 모델을 구축하는 것을 의미했는데, 이는 많은 노력, 시간, 그리고 비용이 소요되는 과정이었습니다. 라마크리슈난은 오늘날 기업이 제품 리뷰를 LLM에 입력하고 데이터 세트에 제품 개선 인사이트가 포함되어 있는지 확인할 수 있다고 말했습니다.

일상 언어나 일반적인 이미지를 다룰 때, LLM은 대규모 텍스트나 이미지 데이터셋으로 훈련되어 있으며, 분류나 탐지 작업을 위해 “즉시 사용 가능(off the shelf)”한 형태로 활용될 수 있다. 예를 들어, 기업은 온라인 제품 리뷰를 분석하여 제품 결함에 대한 사용자 보고서를 식별하고 싶을 수 있다. 과거에는 이러한 리뷰를 식별하기 위해 맞춤형 머신러닝 모델을 구축해야 했으며, 이는 시간, 비용, 노력이 필요한 과정이었다. 현재 기업은 제품 리뷰를 LLM에 입력하고 해당 데이터셋에 제품 개선에 대한 인사이트가 포함되어 있는지 물어볼 수 있다고 라마크리슈난 교수는 설명한다.

라마크리슈난 교수는 GPT-4 및 유사 모델이 "맞춤형 머신 러닝 모델보다 더 정확할 수 있으며, 애플리케이션을 훨씬 더 빨리 구축하고 실행할 수 있다. 생성형 AI 모델의 비용도 점점 저렴해지고 있으므로, 시간이 지남에 따라 가격 때문에 이를 사용하지 못하는 기업은 크게 줄어들 것이다."라고 말한다.

더욱 접근성이 높은 옵션을 원할 때, 생성형 AI 모델을 사용하는 것은 많은 소프트웨어 엔지니어가 별도의 교육 없이도 할 수 있는 일이지만, 머신 러닝 모델을 구축하는 데는 상대적으로 기술적 전문 지식이 필요하다. 라마크리슈난 교수는 "생성형 AI는 그런 의미에서 대중화를 촉진하는 원동력이다. 훨씬 더 쉽게 접근할 수 있게 해준다는 의미다."라고 말했다.

일상적인 정보 활용에 기반한 문제나 기회가 있다면, "예전처럼 반사적으로 머신 러닝으로 돌아가지 말고, 생성형 AI를 먼저 시도해 보라."고 라마크리슈난 교수는 조언한다.

https://mitsloan.mit.edu/ideas-made-to-matter/machine-learning-and-generative-ai-what-are-they-good-for

기존 머신 러닝이 더 나은 선택일 때
하지만 어떤 경우에는 머신 러닝이 여전히 최선의 선택일 수 있다. 다음과 같은 상황일 때다.

개인정보 보호에 대한 우려가 있는 경우, 독점적이거나 민감한 정보 또는 기밀 정보를 LLM에 입력할 때는 데이터 유출 가능성이 있으므로 주의해야 한다. 자체 비공개 모델을 구축할 수는 있지만, 조직에서 쉽게 구할 수 없는 전문 기술이 필요하다. 라마크리슈난은 이러한 상황에서는 "옛날 방식"을 고수하는 것이 좋다고 말했다.

매우 구체적인 도메인 지식을 사용하는 경우, LLM은 널리 이용 가능한 데이터를 기반으로 학습되며 일상적인 정보를 처리하는 데 적합하다. 하지만 MRI 이미지를 기반으로 한 의료 진단(판독)과 같이 매우 기술적이고 특수한 작업에는 정확도가 떨어질 수 있다. "많은 기술 지식이 요구되고 전문 용어가 많이 사용되며, 해당 문제가 회사나 조직에 매우 특수한 분야별 문제를 다루는 경우라면 전통적인 [머신 러닝] 방식을 선택하는 것이 좋다."라고 라마크리슈난 교수는 말한다. 하지만 생성형 AI 모델이 빠르게 발전하고 있기 때문에 시간이 지남에 따라 이러한 방식이 바뀔 수 있다고 덧붙였다.

이미 머신 러닝 모델이 있는 경우, 기업들은 신용카드 결제 같이 금융 거래에서 잠재적 사기 행위를 식별하는 것과 같은 특정 용도를 위한 머신 러닝 프로그램 구축에 많은 노력을 기울여 왔다. 라마크리슈난 교수는 "이미 머신 러닝 모델을 폐기하고 생성 AI 시스템으로 대체해야 할 시급성은 크지 않을 것이다."라고 말했다. "문제는 새로운 사용 사례, 즉 새로운 기능은 무엇인가 하는 것이며, 바로 이 부분에서 의사 결정이 내려질 것이다."

머신 러닝과 생성형 AI를 함께 사용해야 하는 경우
더 나은 결과를 얻기 위해 머신 러닝과 생성형 AI를 함께 사용할 수 있는 경우가 많다. 이러한 시나리오는 다음과 같다.

머신 러닝 모델을 강화하려는 경우, "알고리즘은 세상의 완벽한 시각을 가지고 있지 않으며, 우리가 제공하는 모델만큼만 우수하다. 따라서 생성형 AI를 통해 세상에 대한 더 많은 맥락을 제공할 수 있다면, 이는 모델을 더욱 개선시킬 수 있다."라고 굽타 교수는 말한다.

굽타 교수는 사람들의 이름, 심박수, 달리기 속도가 포함된 데이터 세트를 예로 들었다. 굽타 교수는 "머신러닝 모델은 각 개인의 심장 건강 상태와 같은 정보를 예측하고, 그룹으로 분류하거나, 성과 벤치마킹을 수행할 수 있다. 생성형 AI가 강화된 머신 러닝은 이름에서 나이와 기타 인구 통계를 추론하고, 이 데이터 외부의 맥락을 활용하여 더 많은 정보를 추출할 수 있다."

머신러닝 모델을 쉽게 설계하고 싶을 때, 머신러닝 모델을 구축하려면 원하는 기능과 기술에 대한 데이터와 지침을 생성형 AI 도구에 입력하고, 모델을 구축하고, 다른 데이터 세트에서 평가하고, 모델의 정확도를 보고하도록 요청할 수 있다.

생성형 AI는 “머신러닝 전문가들의 삶과 업무 흐름을 변화시키고 있다.”고 라마크리슈난 교수는 언급하며, 모델의 결과물을 지속적으로 분석하고 비판해야만 환각 현상과 오류가 누적되지 않도록 보장할 수 있다고 강조했다.

머신러닝 모델을 위해 데이터를 생성해야 할 때, 전통적인 머신러닝 모델을 제대로 훈련하기에 충분한 데이터가 없는 경우, 생성형 AI를 사용하여 실제 데이터셋과 동일한 통계적 특성을 가진 합성 데이터를 생성할 수 있다.

머신러닝 모델을 위해 구조화된 데이터를 준비해야 할 때, 산업 현장과 같은 환경에서 표 형식 데이터는 누락된 값과 같은 오류가 포함될 수 있으며, 이러한 오류는 모델 훈련 전에 해결되어야 한다. 수동으로 데이터를 정리하는 대신, LLM에 프롬프트를 제공하여 이상치나 오류를 찾아내도록 할 수 있다.

“생성형 AI는 데이터 수집부터 데이터 정리, 실제 모델링까지 전통적인 머신러닝 워크플로우를 더 효율적으로 만든다.”라고 라마크리슈난 교수는 말한다. “프로세스의 각 단계에서 생성형 AI를 터보차저처럼 사용할 수 있다. 하지만 이에 대한 댓가는 분명히 있는데, LLM이 생성한 출력이 정확함을 보장하기 위해 지속적인 감시가 필요하다는 말이다.”

다양한 AI 도구가 존재하는 상황에서 어떤 도구를 언제 사용할지 결정하는 것은 AI 전문가들이 갖추어야 할 또 다른 역량이 되고 있다.

라마크리슈난 교수는 “결과물을 만들고 싶다면 생성형 AI를 사용하라. 일상적인 것을 예측하고 싶다면 먼저 생성형 AI를 시도해 보라. 특정 분야에 대한 예측이 필요하다면 예측 모델링을 하고 전통적인 머신러닝을 사용하라. 어렵지 않다."라고 말한다.

More MIT resources on machine learning

Ramakrishnan offers guidelines about when to use generative AI versus predictive AI.

This explainer looks at how generative AI systems work, and what make them different than other forms of AI.

This guide to AI basics includes a look at key AI terms, the mechanics of ChatGPT, and how to write generative AI prompts.

Watch Swati Gupta and other MIT experts discuss their research at the recent MIT Ethics of Computing Research Symposium.

MIT Sloan interim dean Georgia Perakis explains machine learning, optimization, and other fundamental AI terms.

출처 : MIT Sloan School of Management 아티클 인용(번역)