É legal que o AIGC use a tecnologia de rastreador para construir uma versão Zhihu do robô GPT?

Este ano, as ferramentas de modelos de inteligência artificial em larga escala, como GPT e pintura de IA, estão em alta, e muitas pessoas também querem seguir a onda de empreendedorismo de IA, e projetos empresariais relacionados surgem indefinidamente. Dados de alta qualidade são cruciais para o treinamento de grandes modelos de IA. Somente com dados suficientes é que ferramentas de IA inteligentes e poderosas podem ser treinadas. a Internet do meu país está crescendo há mais de 20 anos, mas ainda faltam dados? Não, o advogado Mankiw recebeu recentemente perguntas de internautas sobre o uso de rastreadores para rastrear dados de Zhihu. Não seria ótimo ser um robô Zhihu GPT? Espere um minuto, os riscos legais envolvidos não podem ser ignorados.

0****1 Os rastreadores são uma faca de dois gumes

A tecnologia Crawler é uma tecnologia que obtém automaticamente dados da Internet por meio de programação. Seu nome mostra de forma vívida e vívida seu princípio de funcionamento: simular o processo de navegação humana na web em um navegador da web e coletar e obter dados.

Os rastreadores da Web são amplamente utilizados em mecanismos de pesquisa, coleta de dados, filtragem de publicidade, análise de big data e outros campos. Como um poderoso programa de coleta de informações, ele pode melhorar significativamente a eficiência do trabalho, especialmente para a coleta e organização de dados massivos.

No entanto, uma vez que a tecnologia é usada de forma inadequada, ela também causará um "desastre de worm", levando a congestionamento de rede, travamentos, paralisia de servidores e até mesmo riscos de segurança de dados. A "rede de documentos de arbitragem" que conhecemos não é imune:

Figura: Em 2019, o Supremo Tribunal Popular emitiu a "Resposta às Sugestões sobre a Construção do Site da "Rede de Documentos do Julgamento da China""

0****2 Risco de usar a tecnologia de crawler

Os rastreadores, como meio técnico de obtenção de dados, não são proibidos por lei. No entanto, a forma de uso e a finalidade do uso determinam se haverá atos ilícitos e consequências.

1. Uso impróprio

Usando a tecnologia do rastreador, um grande número de visitas ao site pode ser feito em um curto período de tempo, e as páginas e os dados são frequentemente rastreados. Isso pode levar a um aumento acentuado da largura de banda e da carga do servidor do site, afetando assim o funcionamento normal do site e, até mesmo, causando tempo de inatividade ou resposta lenta, interferindo no funcionamento normal do site visitado e, em casos graves, pode pode constituir crime.

Yang autorizou Zhang, um funcionário da empresa, a desenvolver um software de sistema de crédito, e a função "rastreador da web" no software pode ser vinculada ao site de permissão de residência de Shenzhen. Em maio de 2018, o software consultou um grande número de visitas ao sistema de autorização de residência de Shenzhen por duas horas consecutivas, fazendo com que o sistema de autorização de residência de Shenzhen não funcionasse normalmente, o que afetou muito a operação diária do escritório de gestão populacional do Shenzhen Public Secretaria de Segurança, que utiliza o sistema de autorização de residência. Ambos constituíram o crime de sabotar os sistemas de informação do computador. [(2019) Guangdong 0305 Xingchu No. 193]

2. Finalidade de uso imprópria

O modo como as informações e os dados rastreados são usados tem um impacto qualitativo maior no comportamento do rastreador do que como eles são usados. **

O uso ilegal de dados e informações rastreados inclui principalmente:

**(1) Roubo de informações pessoais: **O uso de tecnologia de crawler para capturar informações pessoais de forma maliciosa em sites pode envolver violação da privacidade e informações pessoais de outras pessoas, o que pode configurar gravemente crime de violação de informações pessoais dos cidadãos.

**(2) Comportamento impróprio na concorrência comercial: **Use a tecnologia de rastreador para obter segredos comerciais, informações sobre preços, dados do usuário etc. dos concorrentes e "mover" para outras plataformas após a integração de dados e obtê-los dessa maneira conveniente Uma grande quantidade de dados e informações valiosas para buscar uma vantagem competitiva injusta.

No caso de "Kumike v. Chelai Disputa de Concorrência Desleal", o tribunal sustentou que, sem a permissão do credor, o uso da tecnologia de rastreador da web para inserir o histórico do servidor do credor obteve e usou ilegalmente o barramento em tempo real do credor dados de informação gratuitamente. O comportamento é na verdade um tipo de comportamento de "conseguir algo por nada" e "canibalizar pessoas e engordar", e tem ocupação ilegal de direitos e interesses de propriedade intangíveis de outras pessoas, destruindo as vantagens competitivas de mercado de outras pessoas , e constitui concorrência desleal.

**(3) Violação de direitos de propriedade intelectual: **Rastrear conteúdo protegido por direitos autorais e usá-lo para divulgação pública não autorizada ou fins comerciais é um ato de violação de direitos de propriedade intelectual.

0****3 O risco de os dados do rastreador "alimentarem" modelos grandes

Através da análise anterior, podemos ver que o risco de usar a tecnologia do rastreador está principalmente no método de rastreamento e no conteúdo rastreado. **Seja para controlar a frequência e o conteúdo do rastreamento, rastrear o conteúdo público e usá-lo para treinar robôs é nada arriscar?

Em primeiro lugar, já em 2018, a conta oficial Zhihu divulgou o "Anúncio sobre a atualização da proteção dos direitos e interesses do usuário Zhihu", que mencionava: **Zhihu adota um sistema de lista branca para o uso do conteúdo Zhihu por terceiros e terceiros precisam passar Aplicar através de canais oficiais de cooperação. **Se o comportamento de rastreamento violar os termos de serviço da Zhihu, a Zhihu pode sofrer banimentos de contas, endereços IP ou outras ações legais.

Extraído de "Especificações para o uso de contas institucionais Zhihu" (avaliação)

Em segundo lugar, o conteúdo do Zhihu geralmente é original ou autorizado pelo usuário, e os direitos autorais pertencem ao próprio usuário. O rastreamento e o uso não autorizados desses conteúdos podem envolver a violação dos direitos autorais e autoria de Zhihu.

Na verdade, o treinamento de grandes modelos de IA, "roubo de dados" não é um caso isolado. No mês passado, a Bishen Composition acusou publicamente Xueersi, um ex-sócio, de “roubar dados” por meio de répteis para treinar seus próprios produtos de IA. A Bishen Composition afirmou que resolverá a disputa por meio de procedimentos judiciais, exigindo que "Xueersi" pague 1 yuan em compensação, peça desculpas publicamente e exclua os dados rastreados.

0****4 Resumo

No boom de startups de IA, os dados estão se tornando cada vez mais importantes. Ao se deparar com a atração da tecnologia bot, deve-se reconhecer que, embora a tecnologia bot em si não seja proibida, seu uso inadequado pode levar a questões legais, especialmente em relação a informações pessoais, privacidade, direitos autorais e concorrência desleal.

As “Medidas Provisórias para a Gestão de Serviços de Inteligência Artificial Generativa” mencionam claramente que, no treinamento de atividades de processamento de dados, devem ser usados dados e modelos básicos com fontes legais. No processo de abertura de uma empresa, os chefes devem garantir a legalidade e a moralidade da coleta de dados. Se você deseja usar dados rastreados para treinar grandes modelos de IA, deve obter autorização da fonte de dados com antecedência e cumprir os regulamentos da plataforma relevante.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)