검색
-
-
진화하는 로봇 개, '스팟' 이후 무슨 일이?…인간과 감정 교류 단계
- 보스턴 다이내믹스에서 2019년 공개한 네 발로 걷는 로봇 '스팟(Spot)'이후, 전 세계적으로 사족 보행 로봇개의 개발이 속속 진행되고 있다. 세계적인 IT 전문 매체 기즈모도(GIZMODO)은 최근 취리히 공과대학(ETH Zurich)의 연구팀이 '애니멀(ANYmal)'이라는 사족 보행 로봇개를 개발, 우주 탐사 프로젝트에 활용할 계획이라고 전했다. 중국 로봇 기업 '유니트리 로보틱스(Unitree Robotics: 宇树科技)'는 '유니트리 고2(Unitree Go2)'라는 로봇을 선보였다. 이 로봇은 최소 감지 거리 0.05m, 좁은 사각지대를 피하는 능력, 반구형 초광각 인식 기능을 제공한다. 또한 '유니트리 고2'는 자연어 명령을 처리하며, 영상 실시간 전송과 레이더 고도 지도 제공으로 어디에서나 주변 상황을 모니터링할 수 있다. 이처럼 뛰어난 기능을 갖춘 이 로봇은 산업 운송 수단부터 위험한 환경에서의 작업, 건설 현장, 지하 환경 탐사 등 다양한 임무 수행이 가능할 것으로 기대된다. 중국의 IT 기업 샤오미도 로봇 개 '사이버 독2(CyberDog 2)'를 지난 8월 출시했다. 이 로봇 개는 실제 개의 모습을 똑닮은 디자인과 함께 높은 운동 능력을 자랑한다. 특히 '사이버독 2'는 강화된 운동 능력을 통해 공중제비를 할 수 있으며 넘어져도 손쉽게 일어날 수 있고, 음악에 맞춰 춤을 출 수 있다. 특히, 샤오미의 사이버독 2는 AI 카메라, TOF(Time of Flight, 비행 시간) 센서, 라이다(LiDAR, 레이저 펄스를 발사하여 그 빛이 대상 물체에 반사되어 돌아오는 것을 받아 물체까지 거리 등을 측정하고 물체 형상까지 이미지화하는 기술), 초음파 센서 등 총 19 종류의 센서를 탑재해 주인의 얼굴 표정을 인식하고 AI 음성 대화 시스템을 활용해 주인의 감정을 파악하는 등 인간과 상호작용할 수 있다. 이처럼 로봇개의 진화는 인간의 일상생활에 다양한 변화를 가져올 것으로 예상되며, 로봇 기술의 발전은 미래에 더욱 혁신적인 역할을 해낼 것으로 보인다. 한편, '스팟(Spot)'은 미국 공학회사 보스턴 다이내믹스(Boston Dynamics)가 개발한 사족 보행 로봇이다. 스팟의 프로토타입은 2015년에 처음 공개됐다. 이후 보스턴 다이내믹스는 스팟의 기능과 성능을 계속 개선했고, 다양한 버전의 스팟이 나왔다. 2019년에는 스팟의 상업용 버전이 출시됐다.
-
- IT/바이오
-
진화하는 로봇 개, '스팟' 이후 무슨 일이?…인간과 감정 교류 단계
-
-
마이크로소프트, AI 탑재 백팩 특허 획득
- 기술 대기업 마이크로소프트(MS)는 스마트 센서가 탑재된 인공지능(AI) 기반 백팩 디자인에 대한 특허를 취득했다. 미국 기술 전문매체 톰스 하드웨어(Tom's Hardware)에 따르면 미국 특허청(USPTO)은 지난 5월 출원된 마이크로소프트의 AI 기반 백팩 특허를 최근 승인했다. MS파워유저(MSPowerUser)가 처음 보도한 마이크로소프트의 디지털 비서가 장착된 백팩 특허는 '인공 지능 지원 웨어러블'에 대한 것으로 명시되어 있다. 공개된 AI 탑재 백팩 특허 삽화와 주요 예시 대부분은 독특한 디자인으로 시선을 끌고 있다. MS 스마트 백팩의 주요 디자인 특징으로 암 스트랩(Arm strap)에 여러 개의 센서가 내장됐다. 착용자의 정면을 향하고 있는 이 센서들은 각각 카메라, 마이크, GPS, 나침반 등의 기능을 포함한다. 마이크로소프트는 백팩의 스트랩(strap, 끈)에 햅틱 액추에이터(haptic actuator, 촉각적 피드백을 생성하기 위해 사용하는 장치)뿐만 아니라 LED와 스피커를 추가했다. 스마트 웨어러블에는 일부 실시간 처리가 필요한 것으로 보인다. 따라서 이미지, 텍스트, 음성, 얼굴 및 인지 인식을 제공하기 위해 다양한 인식 모듈이 들어 있다. 백팩에 탑재된 시스템은 AI 스마트 기능을 위해 내장된 처리 능력에 데이터를 공급하는 실시간 모니터뿐만 아니라 기록 장치(온보드 스토리지 사용), 무선 연결, 배터리 전원/충전 등의 기능도 갖추고 있다. 착용자는 위의 모든 감지 및 처리 기능을 갖춘 디지털 백팩을 통해 AI의 향상된 사물 식별과 분석, 주변 기기와의 상호 작용, 상황별 인사이트 확보 등의 혜택을 누릴 수 있을 것으로 예상된다. 위 그림에서 데이터 플로(Flow) 차트는 백팩과 데이터 피드가 개인용 컴퓨터 및 클라우드 서버와 함께 작동하는 방식을 보여준다. 또 다른 삽화(아래 그림)에서는 디지털 백팩을 메고 돌아다니는 사람이 스키장을 탐색하고 슈퍼마켓 가격을 확인하고 콘서트 티켓 예매를 고려하는 모습을 보여준다. 사용자는 때때로 "헤이 백팩, 이 포스터를 내 캘린더에 추가해 줘"와 같이 음성을 통해 백팩에 내장된 AI와 상호 작용할 수 있다. 또는 스트랩의 센서와 상호 작용해 일부 AI 동작 또는 상황에 맞는 작업을 실행할 수도 있다. 마이크로소프트의 특허는 주로 집 밖에서 디지털 비서의 유용성에 대해 집중한 면모가 돋보인다. PC 프로세서는 이제 전용 AI 가속 하드웨어를 갖추기 시작했으며, 마이크로소프트는 사무실 생산성 및 협업 도구에 AI를 빠르게 통합한 것으로 보인다. 그러나 톰스 하드웨어는 마이크로소프트의 AI 백팩은 개발 과정에서 드러난 시장성 부족이나 기타 단점으로 인해 많은 특허가 취소되었기 때문에 실현되지 않을 수도 있다고 전했다.
-
- IT/바이오
-
마이크로소프트, AI 탑재 백팩 특허 획득
-
-
소형 곤충 로봇 '클라리', 좁은 틈새서 형태 변형…재난 대응 혁신 기대
- 미국 콜로라도 대학교 엔지니어들이 곤충처럼 모양을 바꾸고 좁은 틈새를 통과할 수 있는 로봇 '클라리(CLARI)'를 개발했다. 미국 기술 전문매체 인터레스팅엔지니어링은 곤충의 끈기와 적응력에서 영감을 받은 콜로라도 대학교 볼더 캠퍼스(CU 볼더)의 엔지니어 팀이 좁은 공간에서 움직일 수 있도록 형태를 바꿀 수 있는 획기적인 소형 로봇인 클라리(CLARI, Compliant Legged Articulated Robotic Insect)를 개발했다고 최근 보도했다. 사람 손바닥보다 작고 탁구공보다 가벼운 클라리는 정사각형에서 좁고 길쭉한 형태로 모양을 바꿀 수 있어 좁은 공간도 거뜬히 통과할 수 있다. 휴대하기 쉽고 형태 변형 능력을 갖춘 이 작은 로봇은 재난 대응 작업에 혁신을 가져올 것으로 보인다. CU 볼더의 폴 M. 레이디 기계공학과 박사과정에 재학 중인 하이코 카부츠는 보도자료를 통해 "주변 환경에 수동적으로 적응할 수 있는 클라리의 능력은 우리가 미처 생각지도 못한 엄청난 역할을 앞으로 담당할 수 있다"고 말했다. 연구진은 지난 8월 30일 학술지 「고급 지능형 시스템(Advanced Intelligent Systems)」 에 로봇 클라리의 혁신적인 설계를 게재했다. 모듈식 설계 구조로 유연성 갖춰 현재 클라리는 4개의 다리를 가진 모듈식 구조로 설계되었다. 이런 설계 덕분에 다리를 추가하거나 구조를 다양하게 조정하는 것이 가능하다. 카부츠는 거미에서 영감을 받아 거미줄을 통과할 수 있는 8개의 다리를 가진 로봇을 구상하고 있다. 그는 "모듈식 설계는 다양한 용도로 활용 가능한 다용도 도구로의 변신을 가능하게 한다"고 말했다. 클라리는 막대한 잠재력을 가지고 있지만, 현재는 전원과 기본 명령을 전달하는 전선에 의존하고 있다. 이 연구의 공동 저자인 카우식 자야람 조교수는 클라리가 자율적으로 돌아다니기를 기대하고 있다. 자야람은 "클라리는 초기 단계이지만, 제트 엔진 내부나 무너진 건물 잔해 아래와 같이 기계가 접근하기 어려웠던 곳에도 들어갈 수 있는 로봇의 개발이 목표"라고 밝혔다. 동물의 왕국을 모델로 한 로봇을 디자인한 경력이 있는 자야람은 기존의 큐브형 로봇 구조에 도전하고 있다. 그는 "동물들의 다양한 형태처럼 로봇도 다양한 형태를 가질 수 있지 않을까요?"라고 반문했다. 곤충 특성 모방 로봇 자야람은 클라리 개발 이전, 버클리 캘리포니아 대학교에서 바퀴벌레가 좁은 수직 공간을 통과하는 능력을 모방한 로봇을 설계했다. 그는 이런 작업이 시작 단계에 불과하다고 여긴다. 자야람은 "동물의 세계는 디자인에 대한 무한한 영감을 제공합니다. 동물들이 좁은 공간을 통과하는 다양한 방법이 있는데, 왜 단 하나의 방식만을 참고할까요?"라고 질문을 던졌다. 클라리는 기존의 디자인을 발전시켜 수평 간격을 좁히는 데 중점을 뒀다. 이 로봇은 폭이 34mm(약 1.3인치)에서 21mm(약 0.8인치)까지 조절 가능해, 다양한 환경에 적응하며 움직일 수 있다. 장애물 자율 감지 지원 자야람과 카부츠는 클라리의 단순한 형태 변형 능력만으로 만족하지 않고, 센서를 통합하여 클라리가 장애물을 자울적으로 감지하고 회피할 수 있게 만들 계획이다. 특히 로봇에 다리가 추가되면서, 유연성과 힘의 균형을 찾기 위한 연구도 진행하고 있다. 카부츠는 "고르지 못한 울퉁불퉁한 자연 지형을 넘나들거나, 풀잎 같은 장애물을 피하거나, 바위 틈을 기어다닐 수 있는 로봇을 상상해 보세요. 이것이 우리가 목표로 하는 미래 곤충 로봇의 모습이다"라고 말했다. 클라리는 작은 크기, 높은 적응성, 그리고 유연한 모듈식 설계를 통해 로봇공학의 새로운 지평을 열 예정이다. 이러한 특성들은 재난 발생 지역의 구조 활동이나 엔진 내부 점검과 같은 복잡한 작업에 매우 유용하게 사용될 수 있다. 카부츠는 "거미나 파리처럼 움직이는 로봇을 구현한다면, 지금까지 접근하기 어려웠던 지역까지 탐험하게 될 것이다. 말 그대로 하늘도 그 한계가 아니라는 것이죠"라고 말했다. 클라리는 현재 엄청난 잠재력을 갖춘 프로토타입 단계에 있다. 생물체의 독특한 움직임을 모방한 로봇은 미래의 로봇 기술의 가능성을 활짝 열어주고 있다.
-
- IT/바이오
-
소형 곤충 로봇 '클라리', 좁은 틈새서 형태 변형…재난 대응 혁신 기대
-
-
두산에너빌리티, 국내 최초 'K-가스터빈' 상업운전 개시
- 중공업계 큰손 두산에너빌리티가 국내에서 첫 270MW 국산 가스터빈의 상업운전을 성공적으로 시작했다. 미국 에너지 전문 매체 파워매거진은 지난 2일(현지시간) 두산에너빌리티의 'K-가스터빈' 첫 상업운전 성공을 통해 한국이 세계 가스터빈 기술 시장에서 탄탄한 기반을 구축하고 있다고 보도했다. 이 매체에 따르면, 두산에너빌리티는 380MW H급 '초대형' 가스터빈 시장을 개척할 대형 복합화력 가스터빈 발전소 첫 계약도 체결했다. 지난 6월에는 공기업인 한국중부발전과 충청남도 보령시에 569MW급 보령신복합화력발전소 건설 계약을 2억1300만 달러에 체결, 2026년 6월 가동을 목표로 한다. 이번 계약에는 증기터빈과 배열회수보일러(HRSG) 공급도 포함된다. 또한, 두산에너빌리티는 지난 7월 28일 한국서부발전과 공동으로 개발한 경기도 김포 열병합발전소에서 270MW급 가스터빈의 상업운전에 들어갔다. 국내 가스터빈 기술 자체 개발 두산에너빌리티의 이러한 성과는 2022년 3월까지 두산중공업으로 알려진 이 회사의 끈질긴 기술 개발 노력의 결과다. 1896년 설립해 한국의 대형 석탄 발전소 건설을 주도해 온 두산에너빌리티는 1990년대부터 국내 가스터빈 기술 개발에 집중해 왔다. 특히 2005년, 두산중공업은 5MW급 가스터빈을 자체 개발함으로써 기술력을 입증했다. 2013년, 두산중공업은 산업통상자원부(이하 '산자부')와 한국에너지기술연구원이 해외 수입 의존도를 낮추기 위해 추진한 국책 과제인 국내 가스터빈 산업 육성에 중추적인 역할을 해왔다. 두산의 목표는 세계 최대 가스터빈 OEM 업체인 제너럴 일렉트릭, 지멘스 에너지, 미쓰비시 파워, 안살도 에너지아 등이 본사를 두고 있는 미국, 독일, 일본, 이탈리아 등 국제 무대에서 경쟁할 수 있는 가스터빈 산업을 육성하는 것이었다. 'K-가스터빈' 첫 상업 운전 이정표 두산에너빌리티에 따르면 270MW급 DGT6-300H.S1의 효율은 40%가 넘는다. 2022년 3월 첫 번째 점화 이후의 테스트는 국가에서 요구하는 연소 조절 테스트, 출력 변동 테스트, 그리고 비상 정지 테스트를 포함했다고 한국서부발전(KOWEPO)이 밝혔다. 한국서부발전은 두산 본사가 있는 경상남도 창원 공장에서 제조 과정에서 가스터빈의 신뢰성을 평가하고 유지하기 위해 3000개 이상의 계측기를 설치했다고 전했다. 이제 한국서부발전은 국가 전력망과 연계한 8000시간의 실증 운전을 통해 '차세대 K-가스터빈' 개발에 도움이 될 데이터를 확보하고 수출을 뒷받침할 계획이다. 아울러 두산에너빌리티는 시장의 요구에 따라 1500℃ 이상의 고온에서도 견딜 수 있도록 설계된 초합금 소재를 적용하고 43% 이상의 효율을 갖춘 380㎿급 H급 모델인 DGT6-300H.S2 개발에 착수했다. 두산에너빌리티는 최근 한국중부발전과 맺은 계약에 증기터빈과 배열회수보일러(HRSG) 공급도 포함돼 보령 신복합화력발전소는 한국형 표준 복합화력 가스터빈(CCGT) 모델이 탑재된 세계 최초의 프로젝트가 될 것으로 전망된다. 회사 측은 2021년부터 국내 산업계, 학계, 연구계 등 340여 개 기관의 전문성을 활용해 CCGT 모델을 개발해왔다고 밝혔다. 이러한 노력은 신뢰성을 확보하는 데 결정적이었다고 말했다. 또한 "지금까지 국내 가스복합화력발전소는 다양한 형태의 외국산 가스터빈 모델을 적용했기 때문에 효율적인 유지보수 서비스에 많은 어려움이 있었다"고 전했다. 100% 수소연료 가스터빈 개발 추진 두산에너빌리티는 2027년 12월까지 진행되는 국책과제의 일환으로 국내 협력사와 함께 수소를 50%까지 공동 연소할 수 있는 복합화력 가스터빈 개발을 추진 중이다. 이를 위해 한국동서발전은 울산복합화력발전소의 25년 된 E급 가스터빈을 270MW급 H급 수소 가스터빈으로 전환할 예정이다. 두산은 이러한 전환을 통해 상당한 비용 절감 효과를 거둘 수 있을 것으로 전망하고 있다. 회사 측은 "고효율 H급 수소 가스터빈 사용 시, 기존 E급 수소 가스터빈에 비해 연간 최대 약 700억 원(약 5300만 달러)의 연료비를 절감 가능하다"고 밝혔다. 단, 이는 상반기 한국가스공사의 평균 연료비와 수소 비용을 기반으로 하며, 수소 가스터빈의 연간 가동률을 50%로 설정한 가정이다. 또한, "수소를 연료 혼합의 50%로 사용할 경우 기존 100% LNG 연료 가스터빈과 비교해 탄소 배출을 최대 21.4% 줄일 수 있다"고 덧붙였다. 마지막으로 두산에너빌리티와 한국 파트너들은 2027년 12월까지 400MW급 '초대형' 100% 수소 연료 가스터빈을 별도로 개발하고 있다. 두산은 "2026년까지 100% 수소 연료 가스터빈의 핵심 부품인 연소기 개발을 완료하는 것이 목표"라고 밝혔다.
-
- 산업
-
두산에너빌리티, 국내 최초 'K-가스터빈' 상업운전 개시
-
-
네이버, 생성형 AI '하이퍼클로바X' 공개…11월 검색엔진에 통합
- 한국판 생성형 인공지능(AI)이 드디어 베일을 벗었다. 한국 대표 인터넷 대기업 네이버가 최근 생성형 AI '하이퍼클로바 X(HyperCLOVA X)'를 공개하며 세계 AI 경쟁 무대에 데뷔했다. 네이버의 대규모 언어모델(Large Language Model, LLM)은 챗GPT와 유사한 인공지능 챗봇인 '클로바 X'와 마이크로소프트 빙(Bing)에 해당하는 생성형 AI 기반 검색 엔진인 '큐(Cue)'등의 서비스를 제공한다. 세계는 현재 생성형 AI 분야에서의 경쟁이 가열되고 있다. 네이버의 생성형 AI 출시는 다른 글로벌 기업들의 AI 강화 움직임에 발맞춰 이루어진 것이다. 오픈AI는 마이크로소프트의 지원을 받으며 이 경쟁을 선도하고 있다. 구글은 '바드'라는 AI 챗봇을 출시하고 미국 인공지능 스타트업 '앤트로픽'(Anthropic)에 투자하는 한편, 중국의 바이두는 '어니봇'을 선보였다. 메타와 아마존 같은 기업들 또한 자신들만의 AI 챗봇을 곧 선보일 계획이다. 미국이 생성형 AI 분야를 선도하는 가운데, 네이버의 한국판 생성형 AI 출시는 국내외에서 높은 관심을 받고 있다. 해외 IT 전문 매체 테크크런치 보도에 따르면, 네이버 클라우드에서 출시한 '하이퍼클로바 X'는 지난 8월 24일부터 한국어와 영어로 베타 서비스를 시작했다. 그리고 '큐'는 9월의 베타 테스트를 마치고 11월에는 네이버의 기존 검색 엔진과 통합될 계획이다. 네이버 측은 "하이퍼클로바 X는 크리에이터와 기업 고객 모두가 사용 가능하다"라며, 이는 2021년에 출시된 한국어 LLM 하이퍼클로바의 업그레이드 버전이라고 설명했다. 또한, 하이퍼클로바는 2400억 개 이상의 파라미터를 가지고 있음을 공개했지만, 하이퍼클로바 X에 얼마나 많은 파라미터가 학습되었는지는 구체적으로 공개하지 않았다. 네이버 최수연 대표는 주주에게 보낸 서한에서 "회사는 AI 전문가 500명을 보유하고 있으며, 1000억 개 이상의 파라미터로 구성된 대규모 언어 모델을 독자적으로 개발한 전 세계 5개 기업 중 하나"라고 밝혔다. 네이버 클라우드의 기술 및 하이퍼스케일 AI 책임자인 성낙호 총괄은 "네이버 클라우드는 텍스트부터 이미지, 동영상, 오디오에 이르기까지 다양한 데이터를 분석하고 생성하는 다중 모드 언어 모델의 개발을 진행 중"이라고 밝혔다. 즉, 클로바 X는 텍스트, 이미지, 음성 등의 다양한 데이터 형태를 통합해 학습함으로써 기존 언어 모델보다 더 깊은 정보 인식과 풍부한 정보 제공이 가능하다. 네이버는 한국, 일본, 동남아시아뿐만 아니라 중동, 스페인, 멕시코와 같은 비영어권 국가와 정치적으로 민감한 지역에서도 맞춤형 AI 애플리케이션을 제공하려고 한다. 이를 통해 경쟁사들이 아직 진출하지 않은 지역에 주목하고 있다는 점을 강조했다. 네이버의 최수연 대표는 컨퍼런스에서 11월에 60만 대의 서버로 구축된 'GAK 세종'이라는 두 번째 데이터 센터를 한국에서 오픈할 예정이라고 밝혔다. 네이버는 지난해 12월부터 삼성과 함께 하이퍼스케일 AI를 위한 AI 칩 개발에 착수했고, 삼성 또한 곧 기업용 생성형 AI를 출시할 계획이다. 네이버는 판매자, 창작자, 광고주를 포함한 파트너들을 위한 AI 기술 도구를 선보일 예정이다. '클로바 for Writing'이라는 글쓰기 도구와 '클로바 for AD'라는 광고 상품을 통해 다양한 네이버 서비스에 생성형 AI를 신속하게 통합할 계획이다. 또한 네이버 클라우드는 AI 기반의 B2B 상품을 출시하며, '뉴로클라우드'라는 완전 관리형 하이브리드 클라우드 서비스와 '클로바 스튜디오'라는 AI 개발 도구로 고객 기업들의 자체 생성형 AI 구축을 지원할 방침이다. 전문가들은 네이버의 강점이 다양한 서비스와 파트너들이 연계되어 성장을 이끌어내며, 그 결과로 플랫폼의 발전이 이루어지는 '위닝 루프' 구조에 있다고 지적하며, "하이퍼클로바X가 이 과정을 가속화시킬 것"이라고 전망했다.
-
- IT/바이오
-
네이버, 생성형 AI '하이퍼클로바X' 공개…11월 검색엔진에 통합
-
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?
- 마이크로소프트(MS) 창업자 빌 게이츠가 "인터넷의 발명만큼 중대한 사건"이라고 극찬한 챗GPT(Chat GPT)는 오픈AI에서 개발한 대화형 인공지능(AI) 서비스로, 대량의 데이터를 학습해 새로운 정보를 생성하고 응답하는 능력을 갖춘 시스템이다. 챗GPT는 챗(Chat)과 GPT(Generative Pre-trained Transformer)의 합성어로, 트랜스포머(Transformer) 계열의 대규모 언어 모델(GPT-3.5)을 기반으로 한다. GPT-3.5는 오픈AI에서 개발한 GPT-3의 업그레이드 버전으로, 1000억 개의 파라미터를 가지고 있다. 파라미터란 AI가 학습할 수 있는 변수의 수를 의미하는데, 이는 GPT-3의 2배에 달한다. 챗GPT는 강화학습(RLHF) 방식을 채택해 자신의 행동에 따른 보상을 통해 스스로 학습하고 발전할 수 있다. 챗GPT는 번역 및 문장 재구성, 텍스트 요약, 콘텐츠 생성, 코딩 등 다양한 영역에서 우수한 성능을 뽐내고 있다. 무엇보다 인간 고유의 영역이라 여겨져 온 창작의 영역까지 AI가 파고든 사실에 많은 사람이 놀라고 있다. 지난해 11월 선보인 챗GPT는 출시된 지 5일 만에 이용자 수 100만 명을 확보했고, 1억 명을 돌파하는 데는 두 달이면 충분했다. 현재 전 세계적으로 가장 많은 사용자를 보유하고 있는 AI 서비스로 자리매김했다. AI 지능 저하 '드리프트' 현상이란? 인공지능(AI)의 새로운 패러다임인 챗GPT와 같은 채팅AI가 의사 면허 시험을 통과하거나 복잡한 수학 문제를 놀라운 정확도로 풀 수 있다는 보고서도 나왔다. 그런데 최근 챗GPT의 성능이 급격히 저하되는 현상이 나타나 인공지능 학계를 발칵 뒤집어 놓았다. 파겐 와사니 테크롤로지스(Fagen Wasanni Technologies)와 일본 매체 기가진(gigazine)의 최근호에 따르면 올해 3월부터 6월까지 채팅 AI의 수학 능력이 급격히 떨어지는 현상이 발견됐다. 이러한 채팅 AI의 지능 저하 현상을 '드리프트(drift)'라고 한다. 외신에 따르면 미국 스탠포드 대학과 UC 버클리가 올해 3월과 6월 두 차례에 걸쳐 오픈AI의 대규모 언어모델(LLM) 'GPT-3.5'와 'GPT-4'로 구동되는 챗GPT에 '수학 문제', '코드 생성', '시각적 추론', '민감한 질문' 등 4가지 과제를 부여해 그 답변의 신속성과 정확성을 분석했다. 그 결과, '17077은 소수인가?'와 같은 단순 수학 문제에 대한 GPT-4의 응답 정확도가 2023년 3월부터 6월 사이에 97.6%에서 무려 2.4%로 급락한 것으로 나타났다. 두 대학의 연구진에 따르면, "AI의 드리프트 문제는 매우 복잡한 AI 모델의 일부를 개선하려고 할 때 모델의 다른 부분의 성능이 저하되는 문제"라고 설명했다. 연구원들은 3월과 6월 다양한 버전의 LLM을 테스트하고 위의 네 가지 과제 외에 미국 의사 면허 시험, 시각적 추론을 포함한 다양한 AI 작업에서 성능을 평가했다. 그 결과, LLM이 제공하는 답변에 상당한 변동성이 있는 것으로 나타났다. 특히 GPT-4의 수학 문제 해결 능력은 3월과 6월 사이에 정확도가 84.0%에서 51.1%로 떨어지는 등 급격히 악화됐다. 반면, GPT-3.5의 정확도는 같은 기간 동안 49.6%에서 76.2%로 향상됐다. 연구원들은 또한 특정 작업에서 지시를 따르는 GPT-4의 능력이 저하되는 것을 관찰했다. 예를 들어, '행운의' 숫자와 관련된 수학 문제에서 GPT-4의 정확도는 3월과 6월 사이에 83.6%에서 35.2%로 떨어졌고 GPT-3.5의 정확도는 30.6%에서 48.2%로 오히려 증가했다. 또한 ‘민감하거나 위험한 질문’에 답변하려는 LLM의 의지에 변화가 있었다. GPT-4는 응답률이 21.0%에서 5.0%로 급격히 낮아졌고, GPT-3.5는 2.0%에서 5.0%로 소폭 증가했다. 복잡한 추론 과제에서 GPT-4는 정확한 답변을 생성하는 점이 1.2%에서 37.8%로 증가해 개선된 모습을 보였다. 그러나 GPT-3.5의 추론 완전 일치 성공률은 22.8%에서 14.0%로 감소했다. 연구원들은 또한 시간이 지남에 따라 LLM이 생성한 코드의 실행 가능성도 감소하는 것을 관찰했다. 또 미국 의사 면허 시험에서 GPT-4의 성적은 86.6%에서 82.4%로 소폭 하락한 반면, GPT-3.5는 54.7%였다. 시각적 추론 과제에서 약간의 개선이 있었지만 두 모델 모두 전반적인 정확도는 여전히 낮았다. 연구진은 짧은 시간 내에 GPT-3.5와 GPT-4의 성능과 동작에 상당한 변화가 있었다는 점을 강조했다. "AI 미세 조종시 다른 영역서 후퇴" 스탠포드대 제임스 조우(James Zou) 컴퓨터 과학 연구원은 "AI 모델을 미세 조정해 특정 방향으로 강화하면 다른 영역에서는 후퇴할 위험이 있다"며 "AI 모델을 지속적으로 개선하는 것은 매우 어렵다"고 말했다. 또한 조우 연구원은 "우리는 GPT-4와 같은 AI 모델에서 언젠가 드리프트 문제가 발생할 것으로 예상했지만, 이렇게 빨리 드리프트 문제가 발생한 것에 대해 매우 놀랐다"고 했다. 해외 매체 크립토폴리탄(Cryptopolitan)은 AI의 드리프트 문제에 대해 "이 문제는 프롬프트 엔지니어링(Prompt Engineering)이라는 급성장 중인 트렌드와 관련이 있을 수 있다"고 추측했다. '프롬프트 엔지니어링'은 사용자가 프롬프트를 만들어 AI로부터 특정 반응을 이끌어내는 개념이다. 이 매체는 "GPT-4의 수학적 능력 저하가 프롬프트 엔지니어링에 대응하기 위해 취해진 우발적 결과일 수 있다"고 지적했다. 오픈AI "개선 위해 다양한 연구 진행" 드리프트 문제에 대해 오픈AI 측은 "새로운 AI 모델을 출시할 때, 우리는 새로운 모델을 더 똑똑하게 만드는 것을 최우선 과제로 삼고 있다. 또한 우리는 새로운 AI 모델 버전이 포괄적인 작업의 개선으로 이어지고 있는지 확인하기 위해 다양한 조사와 연구를 진행하고 있다. 하지만 우리의 평가 방법은 완벽하지 않기 때문에 지속적으로 개선해 나가고 있다"고 말했다. 조우는 AI의 드리프트 문제에 대해 "중요한 것은 지능이 떨어진다고 해서 기술을 포기하는 것이 아니라 그 어느 때보다 AI를 면밀하게 모니터링하는 것"이라고 말했다. 아울러 연구팀은 챗GPT와 같은 AI 모델에 대해 수천 개의 질문을 던져 체계적인 테스트를 계속하고 있으며, 시간이 지남에 따라 성능 변화를 분석하고 있다고 덧붙였다.
-
- IT/바이오
-
인공지능(AI) 성능 급감하는 '드리프트' 현상 발생 이유는?