소프트웨어

[IT백과] AI 학습과 저작권 충돌, ‘공정 이용’은 어디까지 허용될까?

이안나 기자
[ⓒ pixabay]
[ⓒ pixabay]

[디지털데일리 이안나기자] 인공지능(AI) 기술이 빠르게 진화하면서 저작권을 둘러싼 논쟁이 새 국면에 접어들고 있다. 특히 대규모언어모델(LLM)이나 이미지 생성 모델 같은 방대한 데이터를 학습하는 AI가 등장하면서 ‘학습 데이터 출처’에 관한 질문이 어느 때보다 중요해졌다.

텍스트‧이미지‧코드 등 인터넷에 존재하는 수많은 콘텐츠가 AI 학습에 활용된다. 하지만 이 과정에서 콘텐츠 제공자나 저작권자 동의를 얻지 않은 경우가 많고, 어디까지 허용될 수 있는지 명확한 기준도 부재한 상황이다.

이런 모호한 상황에서 법적 다툼도 속출한다. 미국에선 뉴욕타임즈가 오픈AI와 마이크로소프트(MS) 상대로 소송을 제기했다. AI가 뉴욕타임즈 기사들을 학습에 사용했고, 그 결과 독자들이 원본 기사를 찾아보는 수요가 줄어 수익에 타격을 입었다는 주장이다. 이미지 업계에서도 비슷한 갈등이 이어진다. 게티이미지는 ‘스테이블 디퓨’을 개발한 스태빌리티AI를 상대로 자사 이미지가 무단 사용됐다며 소송을 진행 중이다.

◆ AI 학습과 저작권, ‘공정 이용’이 쟁점=이런 상황에서 주목받는 개념이 바로 미국 저작권법에 명시된 ‘공정 이용(Fair Use)’이다. 공정 이용은 원칙적으로 저작권자의 허락 없이도 특정 조건을 만족하면 저작물을 사용할 수 있도록 허용하는 제도다. 비평, 교육, 학술 연구, 뉴스 보도처럼 사회적 가치가 인정되는 경우, 저작물 일부를 자유롭게 활용할 수 있도록 보장한다.

이 제도는 창작자 권리를 보호하는 대신, 사회 전체 정보 접근권과 표현의 자유도 함께 지키기 위해 마련됐다. 즉, 저작권 보호와 공익적 정보 활용 사이에서 균형을 맞추기 위한 장치다.

공정 이용이 성립하는지 여부는 네 가지 기준을 종합적으로 고려해 판단한다. 구체적으로는 ▲사용 목적이 상업적인지 비영리적인지, 그리고 창의적 변형이 가해졌는지 ▲원저작물의 성격이 사실 기반인지 창작물인지 ▲사용된 분량과 그 중요성 ▲사용이 저작물 시장에 미치는 영향 등을 종합적으로 따진다.

오랫동안 공정 이용은 사회가 지식과 정보를 자유롭게 활용할 수 있도록 길을 열어주는 동시에 창작자 권리를 존중하는 균형추 역할을 해왔다. 하지만 생성형 AI처럼 대규모 학습과 대량 콘텐츠 생성이 가능한 기술은 기존 공정 이용 틀로는 쉽게 해석하기 어렵다.

AI 학습은 데이터 일부가 아닌 수십억 건 데이터 전수 학습을 전제로 한다. 따라서 학습 결과물이 원본과 상당히 유사하거나 원저작물을 대체할 가능성도 존재한다. 이는 공정 이용 기준 중에서도 가장 중요한 ‘시장 영향’ 요소와 연결된다.

반면 AI 개발자들은 ‘변형적 사용(transformative use)’을 강조한다. AI는 원본을 그대로 복제하는 것이 아니라 새로운 형태로 재창조하는 과정이라는 논리다. 일각에선 기술 발전과 표현의 자유를 보호하기 위해 공정 이용 범위를 넓게 해석해야 한다는 주장도 나온다.

◆ AI혁신과 창작자 권리 보호, 균형점은 어디에=AI 학습과 공정 이용을 둘러싼 논쟁은 단순한 법리 다툼을 넘어 사회 전체가 어떤 가치를 선택할 것인지에 대한 질문으로 확장된다.

만약 혁신을 최우선 가치로 내세워 AI 학습을 광범위하게 허용한다면 오랫동안 인류가 쌓아온 창작 자산과 저작권 체계가 흔들릴 수 있다. 창작자가 보호받지 못하는 환경에선 창작의욕이 꺾이고 이는 결국 문화적 다양성과 창의적 생태계 전반을 위협하게 된다. 기술은 발전할지 몰라도 그 기반이 되는 콘텐츠 자산이 메마를 수 있다는 의미다.

반대로 AI 학습을 지나치게 규제하면 기술 발전 속도가 둔화할 수 있다. AI 연구와 혁신의 상당 부분은 대규모 학습 데이터를 기반으로 하고 있기 때문이다. 데이터 접근성이 극도로 제한되면 신기술 개발이 위축되고 글로벌 기술 경쟁에서도 뒤처질 위험이 있다.

실제로 유럽연합(EU)은 ‘AI법’을 통해 고위험 AI 시스템 규제 및 데이터 사용 방식 기준 마련을 논의 중이다. 미국에서도 생성형 AI 학습에 대한 저작권 가이드라인 검토 작업이 활발하다. 데이터 수집과 활용을 둘러싼 법적 기준을 새롭게 정비해야 한다는 요구가 전 세계적으로 확산되고 있다.

한국에서는 지난 1월 ‘AI 기본법’이 국회를 통과해 내년 1월부터 시행될 예정이다. 이 법은 AI 학습 데이터, 투명성, 안전성 등 생성형 AI에 대한 규제와 지원 체계를 담고 있다. 다만 저작권법상 AI 학습 공정 이용 허용 범위 등 구체적 해석이나 하위법령은 아직 마련 중이다. 생성형 AI 시대에 맞는 저작권 가이드라인과 공정 이용 기준을 어떻게 정립할지가 앞으로의 중요한 과제로 남아있다.

이안나 기자
anna@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널