OpenAI precisa de conteúdo de origem humana: negócios e litígios com empresas de mídia
A OpenAI, desenvolvedora do ChatGPT, sabe que 🫦 dados de alta qualidade são fundamentais no negócio de Inteligência Artificial (IA) – e os editores de jornal possuem vastos 🫦 volumes de conteúdo.
Em um documento enviado à Câmara dos Lordes do Reino Unido este ano, a empresa afirmou que seria 🫦 impossível treinar modelos deIA líderes atuais sem utilização de materiais protegidos por direitos autorais. Além disso, limitar suas opções a 🫦 livros e desenhos públicos faria com que seus produtos ficassem abaixo do esperado.
Etapa |
Fonte de Dados |
Finalidade |
1 |
Trilhões de palavras do internet |
Fornecer conteúdo 🫦 para treinar modelos de IA |
2 |
Notícias de origem humana |
Obter respostas relevantes e precisas código de bônus do betano prompts |
Labs de IA criam modelos de linguagem 🫦 de grande porte – a tecnologia subjacente a ferramentas como o chatbot líder da OpenAI – com trilhões de palavras 🫦 obtidas da internet, um recurso vital para fornecer material que permita aos modelos entenderem prompts baseados código de bônus do betano texto e preverem 🫦 as respostas certas para eles.
O acordo da OpenAI com o Financial Times na última semana destaca a necessidade da empresa 🫦 americana de material aceitável, com o diretor-executivo do grupo FT, John Ridding, afirmando:
"É claramente do interesse dos usuários que estes 🫦 produtos contenham fontes confiáveis."
À medida que os labs de IA crescem cada vez mais famintos por texto confiável, atualizado e 🫦 escrito por humanos para aprimorar ainda mais as respostas, a indústria de notícias avalia como atuar de maneira mais efetiva:
- Muitos 🫦 ligados à defesa do jornalismo estão intensificando a luta para defender seu território de direitos autoriais.
- Outros estão ingressando código de bônus do betano compromissos 🫦 com grandes jogadores de IA para alcançar um acordo – e potencialmente obter vantagem competitiva.
O New York Times acertou o 🫦 primeiro grande golpe na defesa código de bônus do betano dezembro, processando a OpenAI e a Microsoft, o principal investidor da empresa de IA, 🫦 por infringimento de direitos autorais. Em documentos judiciais, o jornal demonstrou que os chatbots da OpenAI podem ser induzidos a 🫦 recriar, quase textualmente, artigos de seu arquivo.
A OpenAI, código de bônus do betano resposta, alegou que o "perorismo" do NYT era mais do que 🫦 apenas irrealista: a publicação, segundo a empresa de IA, usou "perorissões enganosas que violem blatantemente os termos de uso da 🫦 OpenAI ... A verdade, que ficará clara no decorrer do caso, é que o Times pagou a alguém para piratear 🫦 os produtos da OpenAI."
A Guerra Fria entre o NYT e a OpenAI fermentava há meses antes do processo ser aberto. 🫦 Em agosto, o jornal bloqueou o rastreador da web da OpenAI – que absorve dados para seus modelos – de 🫦 acessar seu site. O Guardian e a seguiram.
A Reuters e outros tomaram ação para impedir a empresa de ler 🫦 seu material, uma ação que não traz grande peso legal, mas dificulta, código de bônus do betano termos práticos, o uso de notícias como 🫦 dados-treino.
Desde então, outros processos judiciais foram abertos. A Alden Global Capital, fundo de cobertura que possui oito jornais nos EUA, 🫦 entrou com uma
flurry
de ações judiciais contra a ChatGPT e Copilot da Microsoft código de bônus do betano abril.