A inteligência artificial (IA) nos surpreende com seu desempenho em muitas áreas. Mas como as IAs aprendem a fazer o que fazem?
A resposta é simples: alimentando-se de dados massivos da Web. É graças a esses dados que as IAs, como o ChatGPT e o Bard, conseguiram adquirir conhecimentos e habilidades que lhes permitem entender o mundo real com precisão.
Mas esse método de aprendizado levanta questões legais e éticas, principalmente com relação aos direitos autorais. O Google, que faz uso extensivo de dados on-line para treinar suas IAs, propôs a alteração da legislação atual sobre esse assunto.
Neste artigo, daremos uma olhada nessa proposta e em suas implicações.
A proposta do Google sobre a acessibilidade do conteúdo on-line às IAs
O Google propôs que todo o conteúdo on-line seja acessível às IAs para treinamento, a menos que os editores discordem. Em uma proposta ao governo australiano, o mecanismo de busca defendeu uma mudança nas leis de direitos autorais existentes.
O Google quer que as IAs possam acessar todo o conteúdo digital, a menos que os editores decidam não participar. O gigante da Web apresentou essa proposta ao governo australiano para incentivá-lo a alterar as atuais leis de direitos autorais.
Se essas leis forem alteradas, as marcas e os editores terão o ônus de impedir que a IA explore seu conteúdo.
Se não o fizerem, poderão se encontrar competindo com conteúdo muito semelhante e não conseguirão fazer valer seus direitos, o que poderia prejudicar seriamente uma campanha em termos de imagem e identidade.
Em sua carta ao governo australiano, o Google afirma:
“Sistemas de direitos autorais que permitem o uso adequado e justo de conteúdo protegido por direitos autorais para treinar modelos de IA na Austrália em uma ampla e variada gama de dados, ao mesmo tempo em que oferecem suporte a opções de exclusão viáveis para entidades que preferem que seus dados não sejam usados em sistemas de IA.”
O mecanismo de busca já havia apresentado casos semelhantes ao governo australiano, argumentando que a IA deveria ser capaz de fazer uso justo de conteúdo on-line para fins de treinamento.
Mas esta é a primeira vez que o Google sugere uma cláusula de exclusão para tratar de preocupações anteriores.
Qual é o plano do Google em relação ao conteúdo e à IA?
O Google ainda não tem um plano específico, mas expressou seu desejo de estabelecer discussões para implantar um padrão da Web desenvolvido pela comunidade.
Isso poderia ser algo semelhante ao sistema robots.txt, que permite que os editores impeçam que os mecanismos de pesquisa rastreiem seu conteúdo.
Quanto a isso, Danielle Romain, vice-presidente de confiança da Pesquisa Google, anunciou em um comunicado à imprensa no mês passado que:
“Um ecossistema de conteúdo dinâmico beneficia a todos. A chave é que os editores da Web tenham escolha e controle sobre seu conteúdo e oportunidades de alavancar sua participação no ecossistema da Web.
No entanto, reconhecemos que os controles existentes dos editores da Web foram desenvolvidos antes do surgimento de novos usos para IA e pesquisa.
Acreditamosque é hora de a comunidade da Web e de IA explorar meios adicionais e legíveis por máquina para a escolha e o controle do editor da Web para usos emergentes de IA e casos de pesquisa.“
Em outras palavras, é importante ter um ecossistema de conteúdo dinâmico que beneficie todas as partes envolvidas.
A ideia central é que os editores da Web devem ter a liberdade de decidir e controlar seu conteúdo e, ao mesmo tempo, poder se beneficiar de sua participação no ecossistema on-line.
Em resumo
Em conclusão, o Google deseja que a legislação seja favorável ao uso de conteúdo on-line para treinar a inteligência artificial. O objetivo é permitir que os criadores de conteúdo decidam por si mesmos se seu conteúdo pode ser acessado por IAs.