서울대학교 DataScience Day의 앤드류 응의 강연을 듣고 왔다.

앤드류응의 강의의 순서는 크게
- AI 시대의 흐름
- AI Opportunity
- Risk of AI
순으로 진행이 되었다.
AI 시대의 흐름
앤드류 응은 2010년대부터 2020년대까지는 Large Scale의 Supervised learning의 시대였다고 이야기 한다. 당연한 특징이지만 모델 사이즈가 클수록 데이터에 대한 이해력이 높아질 것이기 때문에 특정 성능으로 모델이 수렴하는 한계를 Large Scale모델이 이겨냈던 것이 2010년대의 AI의 과제였다고 이야기한다.
그리고 이번 2020년대의 흐름은 생성형 AI의 시대라고 이야기했다. 지난 십년동안 발전되어온 Large Scale 모델의 연구의 산물로 이제는 ChatGPT같은 생성형 AI시대가 열리게 된 것이고 이는 다양한 가능성을 만들 수 있는 시대라고 이야기한다.
이러한 생성형 AI 시대의 특징으로는 기존에 길게는 10개월까지 걸리던 AI 서비스를 만드는 과정이 생성형 AI와 Prompt Engineernig기반으로 대체되면서 짧게는 몇일 정도만에 AI를 활용한 서비스를 만들 수 있을 수 있게 될 것이라고 이야기 하셨다.

그러한 가능성의 예시로 강연 자리에서 교수님께서 직접 생성형 AI를 활용을하는 몇 줄 안되는 코드로 문장 감별기를 만드셨다.

AI Opportunity
대부분의 산업계에서 필요로 하던 AI 기술은 지도학습의 분류기였지만 이제는 생성형 AI를 활용해서 서비스에 대한 수요가 증가할 것이라고 이야기하셨다. 그렇기에 이러한 AI를 활용하는 사람들에게 UseCase를 찾는 것이 중요하다고 말씀을 하셨다.
하지만 많은 AI 개발자들이 그렇듯 기술을 어떻게 써야할지 잘 모르는 경우가 많다. 앤드류 응 교수님도 이 현상을 지적하면서 왜 아직 인공지능 기술이 많은 분야에 적용되지 못했는지에 대한 설명으로 다음과 같은 그래프를 보여주셨다.

앤드류응 교수님께서는 광고나 웹검색 등 고부가가치 산업의 경우 많은 부분에서 AI가 적용되었지만 그 외에 부가가치가 인건비 대비 낮은 산업의 경우 AI가 아직 적용되지 못하고 있다고 말씀하셨다. 그러면서 이러한 부분에서 생성형 AI가 적용이 활발하게 될 수 있을 것 같고 전문적인 개발자가 아니여도 Low/no code tool과 prompt를 활용하여 AI 서비스를 만들어 나가는 스타트업들이 많아질 것이고 이러한 부분에 주목을 하고 있다고 말씀하셨다.
Risks of AI

ChatGPT에 대해서 사람들이 많은 걱정을 하고 있는건 사실이다. 하지만 사람들이 염려하는 AGI(Artificial General Intelligence)는 아직 연구를 많이 해야하는 부분이라고 말씀하셨다. 또한 인공지능의 발전이 갑작스럽게 비약적으로 발전할 일은 없기 때문에 AI에 대한 현재 언론이나 기사에서의 걱정은 과장된 부분이 많다고 지적하셨다. 그러면서 인공지능이야 말로 인류에게 현재 닥친 위기들(Pandemic, Climate Change...)을 이겨내게 할 수 있는 해결책이라고 강조하면서 강연을 마치셨다.
질의 응답
강연을 마치고 교수님께 질의를 할 수 있는 시간이 있었고 해당 시간에 나온 흥미있었던 질문들에 대해서 정리해보았다.
강화학습은 왜 다른 인공지능 학습 방법론 처럼 많이 발전하지 못할 것으로 예측하셨는가?
강화학습을 위한 데이터셋이나 환경을 구축하기에는 많은 비용이 든다. 또한 그렇게 구축해도 로봇 같이 적용되는 하드웨어나 도메인이 달라지면 성능이 안 좋아지기 때문에 다른 데이터 기반 학습론들 대비 널리 퍼지지 못할 것으로 생각한다.
자연어 분야가 아닌 비전 분야도 챗지피티 같은 폭발적인 성장이 가능할 것으로 보시는가?
자연어 분야는 비전 분야보다 적용될 곳이 많기 때문에 이렇게 까지 많은 성장을 보였다. 따라서 비전 분야가 자연어 분야만큼 많은 임팩트를 끼칠 것인가에 대해서는 확언할 수 없다. 하지만 최근 비전 분야 학회에 가보면 챗지피티가 나오기 직전의 상황가 유사하다. 근 몇년 안에 비전 분야에서도 챗지피티 같은 혁신이 이뤄질 것이라고 생각한다.
헬스 케어 분야는 AI의 진입이 어려운데 이러한 부분에 대해서 어떻게 해결해야할 것 같은가?
헬스케어 분야 중 Improvement of Healthcare Service는 인공지능 분야가 적용되기 상대적으로 수훨할 것으로 생각한다. 이러한 분야를 중심으로 AI가 퍼져나갈 것으로 생각한다.
잡담
최근에 DBR 월간지에서 생성형 AI에 대해서 CEO가 어떻게 바라봐야할지에 대해서 다룬 적이 있다. 거기서 다룬 핵심 포인트는 생성형 AI를 활용한 핵심 서비스를 생각해내는 것이 중요하다는 것이였고 그러한 기업이 흔히 "남들하니깐 우리도 하자"가 아니라 진정으로 흐름을 이끄는 기업이 될 수 있다고 이야기했다.
어찌보면 당연한 말이지만 이러한 흐름 주도를 제일 잘하는 기업은 현재는 MS라는 생각이 들었다.
앤드류응 교수님의 말처럼 생성형 AI를 활용한 서비스들은 앞으로 많이 생길 것이고 이들은 기존에 불편하거나 해결하지 못했던 Pain Point를 해결할 것이다. 그러한 기류에서 가장 돈을 많이 벌 기업은 MS일 것이다.
다음은 클라우드 인프라 서비스를 제공하는 기업들의 시장 접유율을 보여주는 그래프로 이번 2023년도 1분기 AWS는 영업이익 51억 달러에 달하는 돈을 벌어들였다.

많은 개발자들은 클라우드 서비스는 AWS라고 이야기하는 이 시점에 Microsoft는 생성형 AI를 활용해서 이러한 클라우드 인프라의 시장점유율을 늘릴것으로 예상된다.
모든 생성형 AI를 활용하는 회사들은 빅테크와 계약을 맺고 이들의 LLM을 활용할 것이다. 따라서 Microsoft가 원하는 그림은 이러한 기업들이 만드는 서비스가 Azure 클라우드 환경에서 운용되면서 MS에게 이익을 벌어다주는 모습일것이다. 그렇기에 이번에 메타와 Microsoft가 AI partnership을 확대한 것이 아닐까라는 생각이 든다.
https://blogs.microsoft.com/blog/2023/07/18/microsoft-and-meta-expand-their-ai-partnership-with-llama-2-on-azure-and-windows/
Microsoft and Meta expand their AI partnership with Llama 2 on Azure and Windows - The Official Microsoft Blog
In recent months, the remarkable strides made in AI innovation have ignited a wave of transformative possibilities, captivating our collective imagination with the promise of reshaping industries and the way we work. Today, at Microsoft Inspire, Meta and M
blogs.microsoft.com
하지만 생성형 AI가 반드시 다음 시대를 이끌 것이라는 것은 조금 의구심이 든다. 앞써 앤드류 응 교수님이 설명하신 AI가 많이 확산되지 못한 이유는 많은 이유 중에 하나일 것이고 나는 AI가 가지고 있는 근본적인 한계 때문에 산업계에서 널리 퍼지지 못하고 있다고 생각한다.
인공지능은 결국 조건부 확률 모델이다. 비지니스 및 서비스 상황에서 확률적으로 비지니스 로직을 짤 수 있는 서비스는 몇 안될 것이다. 예측이나 조언, 보조등에는 이러한 인공지능이 사용될 수 있지만 이들이 비지니스 로직 한 가운데에 위치할 수 없다고 생각한다. 생성형 AI도 마찬가지다. 처음 ChatGPT가 나왔을 때는 많은 개발자들이 이들의 도움을 받아 코딩을 하곤 했지만 최근 들어 개발자들 사이에 챗지피티가 만든 코드는 신뢰할 수 없다는 지적이 나오기 시작했고 이를 의식한 OpenAI도 ChatGPT Code Interpreter (https://docs.kanaries.net/ko/articles/chatgpt-code-interpreter)등을 출시하면서 이러한 단점을 보완하려는 시도를 보이고 있다. 하지만 개발이라는 것은 개발 상황과 여건, 비지니스 로직, 이해 당사자 간의 합의등 수많은 요소들이 고려되어져야하고 그들의 논의 끝에 스펙이 결정되고 개발이 착수되고 개발 과정에서도 앞써 말한 요인들이 개발방향을 수시로 바꾸곤 한다. 이렇게 유기적인 상황에서는 확률 모델이 많은 부분에서 결정적인 작업을 하지 못할 가능성이 크다고 생각한다.
그렇다고 회사에서 생성형 AI를 포기할 것인가는 또 다른 문제이다. 사람들은 업무의 많은 부분에서 생성형 AI를 활용할 것이다. 생성형 AI에게 질문하는 것은 단순한 질문들도 있을 수 있지만 회사의 기밀등을 수시로 생성형 AI한테 질의할 수도 있다. 그렇기 때문에 여러 회사에서는 챗지피티 사용을 막은 것이다. 하지만 ChatGPT는 너무나 당연하게도 생산성을 대단히 높여준다. 간단한 쿼리나 이메일 작성, 자연어를 통한 데이터에 대한 질의등 많은 부분을 자동화 할 수 있는 너무 강력한 도구이다. 그렇기 때문에 이러한 도구의 사용을 막는 것은 회사 입장에서 양날의 검이 될 수 밖에 없다. 그렇기 때문에 삼성, 네이버, 애플 등 유수의 기업들이 자체 챗지피티를 만들기에 뛰어 든것이다.
앞으로 생성형 AI가 어떤 변화를 일으킬지 조금 더 지켜봐야할 것 같다.