커뮤니티

[ 정보 / 화물∙특장 ] ‘오픈소스’ 문이 닫힌다… 챗GPT가 촉발한 데이터 전쟁

2023-04-21 16:59 기가듀스

985aba12a5dfec3eeca17e80f8d941ab_1682063586_3235.png



생성형 인공지능(AI) 업계가 급성장하며 ‘오픈소스’의 문이 닫히고 있다.

무료로 공개하던 소스코드를 비공개하거나 애플리케이션 프로그램 인터페이스(API)를 유료화하는 등 정책을 폐쇄적으로 바꾸고 있다.

학습과 개발엔 큰 돈이 들어가지만 수익화는 어려운 AI 업계의 현실 때문에 일어나는 현상으로 풀이된다.

매일 약 5700만명이 방문해 다양한 주제로 대화하는 미국의 초대형 커뮤니티 사이트인 ‘레딧’은 수년 간 퍼블릭 API를 통해 구글, 오픈AI,

마이크로소프트(MS)와 등이 개발하는 초거대 인공지능 언어 모델의 학습 자료를 무료로 제공해 왔다.

API는 프로그램(앱)들 사이의 상호작용을 위해 필수적인 매개체다.

아주 쉽게 설명하면 특정 서버의 일부분에 접속해서 그 안의 데이터와 서비스를 사용할 수 있게 해 주는 소프트웨어 도구다.

내부에서만 사용하는 프라이빗 API, 특정 사업 파트너와 공유되는 파트너 API, 모두에게 제공되는 공개(퍼블릭) API가 있다.

하지만 최근 이 회사는 이 API 접근에 요금을 부과하기로 했다. 레딧 창업자이자 최고경영자(CEO)인 스티브 허프먼은 “레딧의

말뭉치 데이터는 상당히 가치있다”며 “그러나 우리가 그 모든 가치를 세계에서 가장 큰 회사들에게 무료로 줄 필요는 없다”고 말했다.

트위터를 인수한 일론 머스크 역시 지난해말 “오픈AI가 AI 모델 학습을 위해 트위터 데이터베이스에 접근하고 있다는 사실을 알게 됐다”며

“앞으로 AI 기업들이 무단으로 데이터베이스에 접근하는 것을 금지시킬 것”이라고 밝혔다.

트위터는 지난 2월 데이터베이스에 접근할 수 있는 API를 유료화 했다.

지적재산권(IP) 개념이 강화되는 다른 분야와 달리, 활발하게 새로운 앱과 서비스를 개발해야 하는 정보통신기술(ICT) 업계에선

개발의 ‘설계도’에 해당하는 소스코드를 무료로 공개하는 흐름이 대세였다.

퍼블릭 API로 외부인이 접근, 사용할 수 있는 데이터와 서비스 영역도 상당히 넓었다.

그런데 이런 흐름은 AI 기술 경쟁이 심화되면서 약해지고 있다.

대기업은 천문학적인 돈을 들여 개발한 AI인데, 후발 주자에게 주도권을 빼앗기면 타격이 크기 때문이고,

중소 기술 기업은 유료 API가 주요 수입원이다.

업계 관계자는 “AI는 수익화가 어려워 스타트업들은 API를 유료화하지 않으면 살아남기 어렵다”고 설명했다.

역설적이게도 이런 오픈소스 폐쇄 흐름은 오픈AI에서 시작됐다.

언어모델 GPT-3를 개발했을 때까지만 해도 소스코드와 API를 공개했지만, GPT-4에 와서는 “‘경쟁 환경’과 ‘안정성’을 위해”

소스코드는 물론 모델 크기와 학습한 데이터, 사용한 하드웨어 등 어떤 정보도 공개하지 않고 있다.

유료 계약을 통해 GPT를 사용할 수 있는 API를 부여하고 있을 뿐이다. GPT의 ‘T’는 ‘트랜스포머’를 의미하는데,

이는 구글이 2017년 논문으로 공개한 언어 모델이다.

구글의 기술 덕에 GPT를 개발한 오픈AI가 후발 주자에겐 어떤 것도 공개하지 않는 셈이다.



https://www.seoul.co.kr/news/newsView.php?id=20230420500210






정리 : 이전엔 프로그램 개발자를 위해 오픈소스란 이름으로 자료를 공개했었지만
이제는 사람이 아닌 대기업이 만든 AI가 각종 커뮤니티나 오픈소스 사이트들의
데이터를 마구잡이로 긁어서 자신들만의 AI 개발에 활용함을 견제하려는 것.
결국 니들 돈벌이 수단인 AI를 우리 데이터로 만들고 있으니 돈을 내라는 얘기임.









 

comments

댓글 0

내용
profile_image

등록된 댓글이 없습니다.