Direitos autorais e IA generativa

Direitos autorais e IA generativa no Brasil

Por · · 3 min de leitura
Direitos autorais e IA generativa no Brasil

Uma notícia recente da InfoMoney sobre home office e geração de profissionais trouxe um dado relevante para o mercado de tecnologia: trabalhadores iniciantes perdem acesso a mentoria informal, observação e correção em tempo real quando atuam remotamente. Esse dado, aparentemente distante do universo jurídico, tem uma conexão direta com o debate sobre IA generativa.

Modelos de linguagem e de geração de imagens aprendem exatamente como aprendizes humanos: por exposição massiva a exemplos. A diferença é que os exemplos usados por sistemas de IA são, frequentemente, obras protegidas por direito autoral, copiadas e processadas sem autorização expressa de seus criadores.

No Brasil, esse processo ainda não tem enquadramento legal claro. O resultado é uma zona cinzenta que afeta diretamente startups de IA, empresas que usam ferramentas generativas e profissionais que criam ou distribuem conteúdo gerado por máquina.

Contexto jurídico e regulatório

O que diz a legislação brasileira

A principal norma aplicável é a Lei nº 9.610/1998, conhecida como Lei de Direitos Autorais (LDA). Ela protege obras literárias, artísticas e científicas desde o momento da criação, sem necessidade de registro. Isso inclui textos, imagens, músicas, código-fonte e bases de dados originais.

O artigo 46 da LDA lista hipóteses de uso livre, sem necessidade de autorização. Nenhuma delas cobre, com clareza, o uso de obras protegidas para treinar sistemas de inteligência artificial em escala comercial. A "exceção de texto e mineração de dados" (TDM, do inglês text and data mining), comum em legislações como a japonesa e a europeia, simplesmente não existe na lei brasileira.

A União Europeia aprovou o AI Act em 2024, com previsões específicas sobre transparência no uso de dados de treinamento. Nos Estados Unidos, múltiplas ações judiciais correm contra empresas como OpenAI, Stability AI e Meta, discutindo se o uso de obras protegidas para treinamento configura infração ao Copyright Act. No Brasil, esse debate ainda não chegou ao Poder Judiciário de forma estruturada, mas o risco existe agora.

O PL 2.338/2023, proposta brasileira de regulação de IA aprovada no Senado em dezembro de 2024 e em tramitação na Câmara em 2025, trata de transparência e responsabilidade, mas não resolve a questão autoral de forma direta. A lacuna permanece, e quem opera nesse mercado precisa considerar que a ausência de regra específica não significa ausência de responsabilidade.

Impacto prático

Para startups que desenvolvem ou distribuem soluções baseadas em IA generativa, o risco mais imediato é a responsabilidade civil por uso não autorizado de obras em treinamento. Isso pode vir na forma de ações de titulares de direitos, associações de autores ou mesmo de concorrentes que busquem obstar o produto. Empresas que usam datasets de terceiros sem due diligence sobre a origem do conteúdo estão expostas.

Do ponto de vista contábil, esse risco precisa ser tratado como passivo contingente, conforme o CPC 25 (Provisões, Passivos Contingentes e Ativos Contingentes). Se a probabilidade de uma demanda for possível, a empresa deve divulgar em nota explicativa. Se for provável e o valor estimável, deve provisionar. Ignorar esse ponto pode gerar distorções nas demonstrações financeiras e comprometer rodadas de investimento ou processos de M&A.

Para CTOs e times de produto, a recomendação prática é documentar a origem de todos os dados usados em treinamento, priorizar datasets com licenças abertas ou com autorização expressa (como o Common Crawl filtrado, o LAION com restrições ou dados proprietários licenciados), e incluir cláusulas de indenização nos contratos com fornecedores de modelos e APIs. Founders devem tratar esse tema como parte do compliance desde o estágio inicial, e não como algo a resolver na due diligence de uma rodada Série A.

Considerações finais

O direito autoral aplicado à IA generativa é um dos temas jurídicos mais urgentes para o ecossistema de tecnologia brasileiro. A falta de regulação específica não protege as empresas: ela cria incerteza, e incerteza tem custo real, para founders, para investidores e para os profissionais que constroem produtos sobre essa base.

O caminho mais seguro passa por três frentes: transparência na origem dos dados de treinamento, contratos bem estruturados com fornecedores e parceiros, e acompanhamento próximo da tramitação do PL 2.338/2023. Quem tratar esse tema como prioridade hoje terá vantagem competitiva e menos surpresas amanhã.

Perguntas frequentes

Usar dados da internet para treinar um modelo de IA é ilegal no Brasil?

Não existe proibição explícita, mas também não existe autorização legal clara. A Lei nº 9.610/98 protege obras publicadas na internet da mesma forma que protege obras em outros meios. O uso não autorizado para treinamento pode ser interpretado como reprodução indevida, especialmente se o conteúdo for reproduzido ou gerado de forma derivada no output do modelo.

Conteúdo gerado por IA tem direito autoral no Brasil?

A posição dominante na doutrina brasileira é que não. A LDA exige que a obra seja criada por um ser humano para ser protegida. Conteúdo gerado de forma autônoma por IA, sem contribuição criativa humana relevante, não é protegido. Se houver curadoria, seleção ou edição criativa por um humano, essa contribuição pode ser protegida separadamente.

Como tratar o risco autoral de IA generativa na contabilidade da startup?

Conforme o CPC 25, o risco deve ser avaliado quanto à probabilidade (possível, provável ou remota) e ao valor estimável. Se for possível, divulga-se em nota explicativa. Se for provável e estimável, provisiona-se no passivo. Ignorar esse ponto pode comprometer a credibilidade das demonstrações financeiras em processos de due diligence e captação.

O PL 2.338/2023 resolve a questão de direitos autorais em IA?

Não diretamente. O projeto foca em transparência, responsabilidade e direitos fundamentais relacionados ao uso de IA. A questão autoral específica, sobre o uso de obras protegidas em treinamento, não está resolvida no texto aprovado pelo Senado. Ela demandaria alteração na LDA ou legislação complementar.

Quais cláusulas contratuais são essenciais ao usar APIs de IA generativa de terceiros?

As cláusulas mais importantes são: indenização por infração autoral oriunda do modelo do fornecedor; declaração sobre a origem e licenciamento dos dados de treinamento; limitação de responsabilidade em caso de demandas de titulares de direitos; e definição clara sobre quem é responsável pelo output gerado. Esses pontos devem ser revisados por advogado especializado antes da assinatura.

Decisão jurídica ou contábil pendente?

A SAFIE atende founders e gestores com acesso direto aos sócios — jurídico e contabilidade integrados sob o mesmo teto. Conversamos para entender o caso antes de qualquer recomendação.

Falar com a SAFIE
Sobre os autores

Conteúdo produzido pela SAFIE, consultoria jurídico-contábil para empresas digitais e de tecnologia. A SAFIE é liderada por Lucas Mantovani e Italo Cunha.

Artigos relacionados

Mais artigos em breve.