위픽레터

[오픈AI o1] 생각하는 인공지능

위픽코퍼레이션

2024.09.27 10:00
  • 427
  • 콘텐츠에 ‘좋아’해줘서 고마워요 -
    0
  • 0
오픈AI가 갑자기 새로운 AI모델을 공개했어요.

OpenAI-o1 수학올림피아드에서 83점 획득 (GPT-4o는 13점)




o1은 반응하기 전에 생각하는 데 더 많은 시간을 할애하도록 설계되었다고 합니다. 대부분의 생성형 AI가 학습하는 통상적인 방식은 입력 매개변수와 데이터를 늘리는 것인데, 이런 방법은 거대한 컴퓨팅 파워(GPU)가 필수적입니다. 이에 반해 o1은 인공지능에게 사고할 시간을 더 할애해주는 방식으로 성능을 발전시키는 것이죠.

사람처럼 질문에 반응하기 전에 문제를 생각하는 데 더 많은 시간을 할애하도록 훈련시켰더니 사고 과정을 개선하고, 다양한 전략을 시도하고, 실수를 인식하는 법을 배우더랍니다. 이런 것을 추론모델이라고 합니다. 기존 모델과의 중요한 차이점은 AI에게 추론만을 가르쳤음에도 불구하고 능력이 저절로 가능해 진 것이다 라는 점입니다.

물리학, 화학, 생물학에서 박사 과정 학생과 비슷한 성과를 보이고, 수학과 코딩에서도 뛰어난 성과를 보였다고 합니다. 국제 수학 올림피아드(IMO) 예선 시험에서 GPT-4o는 문제의 13%만을 올바르게 풀었고 o1은 83%를 풀었다고 합니다.



ChatGPT Plus 및 Team 사용자는 지금 부터 사용가능

지금 바로 ChatGPT에서 o1 을 사용할 수 있습니다. o1은 두가지 버전이 있는데 o1-preview의 경우 30개 메시지, o1-mini의 경우 50개의 메시지까지 사용할 수 있습니다.

 

ChatGPT 모델 선택 캡쳐
 

데모 영상에 등장한 한글

한국에서 화제가 되는 '에어비앤비 체'라는 것이 있습니다. 해외여행 중 방문한 숙소나 식당에 안좋은 후기를 남길 때 일부러 자음 모음을 분해하거나 이상하게 재조합해서 한국인들끼리만 이해할 수 있도록 한글을 변형해서 사용하는 것이죠. 아래 캡쳐 이미지의 한글을 읽어보세요. 한국인들이라면 읽고 이해할 수 있을거에요. 하지만 외국인과 번역기는 알아들을 수 없는 의미없는 말이죠. 일종의 패턴이 없는 ‘암호’입니다.

 

출처: 미상
 
그런데 OpenAI o1에게 에어비앤비체로 일부러 잘못된 문장을 입력했음에도 스스로 추론해서 원래 의미를 찾아 냈습니다.

실제로 테스트 해보니 입력하는 예시에 따라서 ChatGPT 4o도 어느 정도는 해결 하더라구요, 아마 지식데이터가 입력 되었을 수도 있겠죠. 그러나 4o는 생각하고 구조화 하는 과정 없이 즉시 모른다고 대답했고, o1은 생각한 흔적이 보이네요. 

 


이 데모는 AI가 더 이상 입력된 데이터에 기반한 단순한 명령 실행에서 머무르지 않고, '인간의 뇌 처럼' 추론과 실수를 통해 문제 해결을 통해 처리할 수 있는 단계로 나아가고 있음을 보여줍니다.

 

  • #AI
  • #GPT
  • #생성형AI
  • #openAI
  • #o1