Uma notícia recente da InfoMoney sobre home office e geração de profissionais trouxe um dado relevante para o mercado de tecnologia: trabalhadores iniciantes perdem acesso a mentoria informal, observação e correção em tempo real quando atuam remotamente. Esse dado, aparentemente distante do universo jurídico, tem uma conexão direta com o debate sobre IA generativa.
Modelos de linguagem e de geração de imagens aprendem exatamente como aprendizes humanos: por exposição massiva a exemplos. A diferença é que os exemplos usados por sistemas de IA são, frequentemente, obras protegidas por direito autoral, copiadas e processadas sem autorização expressa de seus criadores.
No Brasil, esse processo ainda não tem enquadramento legal claro. O resultado é uma zona cinzenta que afeta diretamente startups de IA, empresas que usam ferramentas generativas e profissionais que criam ou distribuem conteúdo gerado por máquina.
Contexto jurídico e regulatório
O que diz a legislação brasileira
A principal norma aplicável é a Lei nº 9.610/1998, conhecida como Lei de Direitos Autorais (LDA). Ela protege obras literárias, artísticas e científicas desde o momento da criação, sem necessidade de registro. Isso inclui textos, imagens, músicas, código-fonte e bases de dados originais.
O artigo 46 da LDA lista hipóteses de uso livre, sem necessidade de autorização. Nenhuma delas cobre, com clareza, o uso de obras protegidas para treinar sistemas de inteligência artificial em escala comercial. A "exceção de texto e mineração de dados" (TDM, do inglês text and data mining), comum em legislações como a japonesa e a europeia, simplesmente não existe na lei brasileira.
A União Europeia aprovou o AI Act em 2024, com previsões específicas sobre transparência no uso de dados de treinamento. Nos Estados Unidos, múltiplas ações judiciais correm contra empresas como OpenAI, Stability AI e Meta, discutindo se o uso de obras protegidas para treinamento configura infração ao Copyright Act. No Brasil, esse debate ainda não chegou ao Poder Judiciário de forma estruturada, mas o risco existe agora.
O PL 2.338/2023, proposta brasileira de regulação de IA aprovada no Senado em dezembro de 2024 e em tramitação na Câmara em 2025, trata de transparência e responsabilidade, mas não resolve a questão autoral de forma direta. A lacuna permanece, e quem opera nesse mercado precisa considerar que a ausência de regra específica não significa ausência de responsabilidade.
Impacto prático
Para startups que desenvolvem ou distribuem soluções baseadas em IA generativa, o risco mais imediato é a responsabilidade civil por uso não autorizado de obras em treinamento. Isso pode vir na forma de ações de titulares de direitos, associações de autores ou mesmo de concorrentes que busquem obstar o produto. Empresas que usam datasets de terceiros sem due diligence sobre a origem do conteúdo estão expostas.
Do ponto de vista contábil, esse risco precisa ser tratado como passivo contingente, conforme o CPC 25 (Provisões, Passivos Contingentes e Ativos Contingentes). Se a probabilidade de uma demanda for possível, a empresa deve divulgar em nota explicativa. Se for provável e o valor estimável, deve provisionar. Ignorar esse ponto pode gerar distorções nas demonstrações financeiras e comprometer rodadas de investimento ou processos de M&A.
Para CTOs e times de produto, a recomendação prática é documentar a origem de todos os dados usados em treinamento, priorizar datasets com licenças abertas ou com autorização expressa (como o Common Crawl filtrado, o LAION com restrições ou dados proprietários licenciados), e incluir cláusulas de indenização nos contratos com fornecedores de modelos e APIs. Founders devem tratar esse tema como parte do compliance desde o estágio inicial, e não como algo a resolver na due diligence de uma rodada Série A.
Considerações finais
O direito autoral aplicado à IA generativa é um dos temas jurídicos mais urgentes para o ecossistema de tecnologia brasileiro. A falta de regulação específica não protege as empresas: ela cria incerteza, e incerteza tem custo real, para founders, para investidores e para os profissionais que constroem produtos sobre essa base.
O caminho mais seguro passa por três frentes: transparência na origem dos dados de treinamento, contratos bem estruturados com fornecedores e parceiros, e acompanhamento próximo da tramitação do PL 2.338/2023. Quem tratar esse tema como prioridade hoje terá vantagem competitiva e menos surpresas amanhã.