Virando a Moeda de IA

iniciantes5/6/2024, 12:41:32 PM
O artigo explora o potencial e os desafios de combinar IA com Web3. O autor aponta que, apesar do sentimento otimista em relação a "IA + Web3," existem barreiras significativas de investimento em hardware e pesquisa na realidade, levando a grandes empresas de tecnologia dominando o campo da IA. Os projetos Web3 utilizam crowdsourcing incentivado por meio de criptografia, tornando difícil competir com o financiamento substancial investido por essas empresas.

TLDR

Este não é outro artigo otimista de VC sobre “AI + Web3”. Estamos otimistas sobre a fusão de ambas as tecnologias, mas o texto abaixo é um chamado às armas. Caso contrário, o otimismo não acabará justificado.

Porquê? Porque desenvolver e executar os melhores modelos de IA requer despesas de capital significativas no hardware mais avançado e muitas vezes difícil de obter, bem como P&D muito específico do domínio. Atribuir incentivos cripto para obter esses recursos, como a maioria dos projetos de IA Web3 está fazendo, não é suficiente para superar dezenas de bilhões de dólares investidos por grandes corporações que controlam o desenvolvimento de IA de forma firme. Dadas as restrições de hardware, este pode ser o primeiro grande paradigma de software que engenheiros inteligentes e criativos fora das organizações incumbentes não têm recursos para desafiar.

O software está "devorando o mundo" cada vez mais rápido, prestes a decolar exponencialmente com a aceleração da IA. E todo esse "bolo", com a situação atual, está indo para as grandes empresas de tecnologia - enquanto os usuários finais, incluindo governos e grandes empresas, sem falar nos consumidores, ficam ainda mais dependentes de seu poder.

Desalinhamento de incentivos

Tudo isso não poderia ter se desenrolado em um momento mais inadequado - com 90% dos participantes da web descentralizada ocupados perseguindo a galinha dos gansos de ouro do desenvolvimento orientado pela narrativa. Sim, os desenvolvedores estão seguindo os investidores em nosso setor e não o contrário. Varia de admissão aberta a motivação mais sutil e subconsciente, mas as narrativas e os mercados que se formam em torno delas impulsionam muitas tomadas de decisão na Web3. Os participantes estão muito engolfados em uma bolha reflexiva clássica para perceber o mundo lá fora, exceto por narrativas que ajudam a avançar ainda mais esse ciclo. E a IA é obviamente a maior, já que também está passando por um boom próprio.

Conversamos com dezenas de equipes na interseção da IA x Cripto e podemos confirmar que muitas delas são muito capazes, orientadas por missão e construtores apaixonados. Mas tal é a natureza humana que, quando confrontados com tentações, tendemos a sucumbir a elas e então racionalizar essas escolhas pós-fato.

O caminho fácil para a liquidez tem sido uma maldição histórica da indústria de criptomoedas - responsável por retardar seu desenvolvimento e adoção útil por anos neste ponto. Isso desvia até os discípulos de criptomoedas mais fiéis para "bombar o token". A justificativa é que, com mais capital em mãos na forma de tokens, esses construtores podem ter melhores chances.

Relativamente baixa sofisticação de capital institucional e de varejo cria oportunidades para os construtores fazerem reivindicações desconectadas da realidade, enquanto ainda se beneficiam de valorações como se essas reivindicações já tivessem se concretizado. O resultado desses processos é um risco moral e destruição de capital efetivamente arraigados, com muito poucas dessas estratégias funcionando a longo prazo. A necessidade é a mãe de todas as invenções e quando ela se vai, também se vão as invenções.

Não poderia ter acontecido em pior momento. Enquanto todos os empreendedores de tecnologia mais inteligentes, atores estatais e empresas, grandes e pequenas, estão correndo para garantir sua parcela de benefícios provenientes da revolução da IA, os fundadores e investidores de criptomoedas estão optando por um "rápido 10x". Em vez de uma vida inteira de 1000 x, que é o verdadeiro custo de oportunidade aqui, na nossa visão.

Um Resumo Geral da Paisagem da IA Web3

Dadas as incentivos mencionados acima, a taxonomia do projeto de IA Web3 realmente se resume a:

  • Legítimo (também subdividido entre realistas e idealistas)
  • Semi-legítimo e
  • Falsificadores

Basicamente, achamos que os construtores sabem exatamente o que é necessário para acompanhar sua concorrência Web2 e os verticais onde é realmente possível competir e onde é mais um sonho distante, mas que ainda é possível vender para VCs e público não sofisticado.

O objetivo é poder competir aqui e agora. Caso contrário, a velocidade do desenvolvimento da IA pode deixar o Web3 para trás, enquanto o mundo salta para o distópico Web4 da IA corporativa no Ocidente versus a IA estatal da China. Aqueles que não podem ser competitivos em breve e dependem da tecnologia distribuída para alcançar ao longo do tempo são muito otimistas para serem levados a sério.

Obviamente, esta é uma generalização muito grosseira e até o grupo falso contém pelo menos algumas equipes sérias (e talvez mais apenas sonhadores delirantes). Mas este texto é um apelo às armas, então não pretendemos ser objetivos, mas sim apelar ao senso de urgência do leitor[1].

Legítimo:

  • Middleware para "trazer AI para a blockchain". Os fundadores por trás dessas soluções, que não são muitos, entendem que o treinamento descentralizado ou inferência de modelos que os usuários realmente desejam (o estado-da-arte) é inviável, senão impossível no momento. Portanto, encontrar uma maneira de conectar os melhores modelos centralizados com o ambiente da blockchain para permitir que ela se beneficie da automação sofisticada é um bom primeiro passo para eles. Enclaves de hardware TEEs(processadores ‘air-gapped’) que podem hospedar pontos de acesso da API, oráculos de 2 lados (para indexar dados on e off-chain bidirecionalmente) e fornecer ambientes de computação off-chain verificáveis para os agentes, parecem ser a melhor solução no momento. Também existem arquiteturas de co-processador que usam provas de conhecimento zero (ZKPs) para capturar alterações de estado (em vez de verificar a computação completa) que também consideramos viáveis a médio prazo.
    A abordagem mais idealista para o mesmo problema tenta verificar a inferência off-chain para equipará-la à computação on-chain em termos de pressupostos de confiança. O objetivo disso deve ser permitir que a IA execute tarefas on e off-chain em um ambiente de execução coeso, em nossa opinião. No entanto, a maioria dos defensores da verificabilidade da inferência falam sobre "confiar nos pesos do modelo" e outros objetivos complicados do mesmo tipo que se tornam relevantes em anos, se é que se tornam. Recentemente, os fundadores deste grupo começaram a explorarabordagens alternativaspara verificabilidade de inferência, mas originalmente era baseado em ZKP. Enquanto muitas equipes inteligentes estão trabalhando em ZKML, como passou a ser conhecido, eles estão correndo um risco muito grande ao antecipar que as otimizações criptográficas superam a complexidade e os requisitos de computação dos modelos de IA. Portanto, consideramos que eles não estão aptos para competir, pelo menos por enquanto. Ainda, @ModulusLabs/capítulo-14-o-primeiro-llm-on-chain-do-mundo-7e389189f85e">alguns progressos recentes são interessantes e não devem ser ignorados.

Semi-legítimo:

  • Aplicativos de consumidor que usam invólucros em torno de modelos de código fechado e aberto (por exemplo, Stable Diffusion ou Midjourney para geração de imagens). Algumas dessas equipes são as primeiras no mercado e têm tração real do usuário. Portanto, não é justo chamá-los genericamente de falsos, mas há apenas alguns que estão pensando profundamente sobre como evoluir seus modelos subjacentes de forma descentralizada e inovar no design de incentivos. Existem algumas abordagens interessantes de governança/propriedade no componente de token aqui e ali. Mas a maioria dos projetos nesta categoria simplesmente adiciona um token a um invólucro centralizado, por exemplo, na API da OpenAI, para obter um prêmio de valuation ou liquidez mais rápida para a equipe.

O que nenhum dos dois campos acima aborda é o treinamento e inferência para modelos grandes em configurações descentralizadas. Atualmente, não há maneira de treinar um modelo fundamental em um tempo razoável sem depender de clusters de hardware fortemente conectados. O "tempo razoável", dado o nível de competição, é o fator chave.

Algum pesquisa promissorasobre o tópico surgiu recentemente e, teoricamente, abordagens como Fluxo de Dados Diferencialpode ser expandido para redes de computação distribuída para aumentar sua capacidade no futuro (à medida que as capacidades de rede acompanham os requisitos de fluxo de dados). Mas o treinamento de modelo competitivo ainda requer comunicação entre clusters localizados, em vez de dispositivos distribuídos individuais, e computação de ponta (as GPUs de varejo estão se tornando cada vez mais não competitivas).

A pesquisa sobre a localização (uma das duas formas de descentralização) da inferência através da redução do tamanho do modelo também foiprogredindo recentemente, mas não existem protocolos existentes no Web3 que o aproveitem.

Os problemas com treinamento e inferência descentralizados logicamente nos levam ao último dos três campos e de longe o mais importante e, portanto, tão emocionalmente desencadeador para nós ;-)

Fakers:

  • Aplicativos de infraestrutura principalmente no espaço de servidor descentralizado, oferecendo hardware básico ou também ambientes de treinamento/hospedagem de modelo descentralizado. Também existem projetos de infraestrutura de software que estão promovendo protocolos, por exemplo, aprendizado federado (treinamento de modelo descentralizado) ou aqueles que combinam os componentes de software e hardware em uma única plataforma, onde é essencialmente possível treinar e implantar seu modelo descentralizado de ponta a ponta. A maioria deles carece da sofisticação necessária para realmente abordar os problemas declarados e prevalece aqui o pensamento ingênuo de “incentivo de token + vento de mercado”. Nenhuma das soluções que vimos nos mercados público e privado se aproxima de uma competição significativa aqui e agora. Alguns podem evoluir para ofertas viáveis (mas de nicho), mas precisamos de algo novo e competitivo aqui e agora. E isso só pode acontecer por meio de um design inovador que aborda gargalos de computação distribuída. No treinamento, não apenas a velocidade, mas também a verificabilidade do trabalho realizado e a coordenação das cargas de trabalho de treinamento são um grande problema, o que contribui para o gargalo de largura de banda.

Precisamos de um conjunto de modelos fundamentais competitivos e verdadeiramente descentralizados e eles requerem treinamento e inferência descentralizados para funcionar. Perder a IA pode negar completamente qualquer conquista feita desde a chegada do Ethereum pelos "computadores mundiais descentralizados". Se os computadores se tornarem IA e a IA for centralizada, não haverá computador mundial para falar, exceto alguma versão distópica disso.

Treinamento e inferência são o coração da inovação em IA. Quando o restante do mundo da IA está se movendo em direção a arquiteturas mais coesas, a Web3 precisa de alguma solução ortogonal para competir, porque competir de frente está se tornando menos viável muito rapidamente.

Tamanho do Problema

Tudo se resume a computação. Quanto mais você usar tanto no treinamento quanto na inferência, melhores serão seus resultados. Sim, há ajustes e otimizações aqui e ali e a própria computação não é homogênea - agora há uma variedade de novas abordagens para superar os gargalos da arquitetura tradicional de Von Neumann para unidades de processamento - mas ainda assim tudo se resume a quantas multiplicações de matriz você pode fazer em relação ao tamanho de um bloco de memória e à velocidade com que pode fazê-las.

É por isso que estamos testemunhando uma construção tão forte na frente dos data centers pelos chamados 'Hyperscalers', que estão todos procurando criar uma pilha completa com um modelo de IA poderoso no topo e hardware que o alimenta por baixo: OpenAI (modelos) + Microsoft (computação), Anthropic (modelos) + AWS (computação), Google (ambos) e Meta (cada vez mais ambos por meio de um aumento na construção de seus próprios data centers). Existem mais nuances, dinâmicas de interação e partes envolvidas, mas vamos deixar de fora. O quadro geral é que os Hyperscalers estão investindo bilhões de dólares, como nunca antes, na construção de data centers e estão criando sinergias entre suas ofertas de computação e IA, esperando gerar enormes lucros à medida que a IA se espalha pela economia global.

Vamos apenas olhar para o nível de construção esperado apenas este ano pelas 4 empresas:

  • Meta antecipa $30-37bndespesas de capital em 2024, que provavelmente estarão fortemente inclinadas para centros de dados.
  • Microsoft gastou cerca de $11.5 bilhões em 2023em CapEx e é amplamente rumorado para investir mais $40-50bn em ‘24-‘25! Isso pode ser parcialmente inferido pelos enormes investimentos em data centers sendo anunciados em apenas alguns países isolados: $3.2bno Reino Unido, $3.5bnna Austrália, $2.1bnem Espanha, €3.2bnna Alemanha,$1bnno estado americano da Geórgia e$10bnem Wisconsin, respectivamente. E esses são apenas alguns dos investimentos regionais de sua rede de 300 data centers abrangendo 60+ regiões. Há tambémconversas de um supercomputador para OpenAI que pode custar à Microsoft mais US $ 100 bilhões!
  • Liderança da Amazonesperaseu CapEx deve crescer significativamente em 2024 a partir dos $48 bilhões que gastaram em 2023, impulsionado principalmente pela expansão da infraestrutura da AWS para construção de IA.
  • Google gastou $11bnpara ampliar seus servidores e centros de dados apenas no quarto trimestre de 2023. Eles admitem que esses investimentos foram feitos para atender à demanda esperada de IA e estão prevendo que a taxa e o tamanho total de seus gastos com infraestrutura aumentem significativamente em 2024 devido à IA.

E assim foi gasto em hardware de IA da NVIDIA apenas em 2023:

Jensen Huang, CEO da NVIDIA, tem lançado um total de US$ 1 trilhão para ser investido na aceleração de IA nos próximos anos. Uma previsão que ele fez recentemente dobradopara $2tn, alegadamente provocado pelo interesse que testemunhou por parte dos players soberanos. Os analistas da Altimeter esperam um gasto de $160bn e mais de $200bn em data centers relacionados com IA a nível global em ‘24 e ‘25, respectivamente.

Agora, comparar esses números com o que o Web3 tem a oferecer aos operadores de centro de dados independentes para incentivá-los a expandir CapEx em hardware de IA mais recente:

  • O valor de mercado total de todos os projetos de Infraestrutura Física Descentralizada (DePIn) está atualmente em torno de $40bn em tokens relativamente ilíquidos e predominantemente especulativos. Essencialmente, os market caps dessas redes são iguais à estimativa do limite superior do total de CapEx de seus contribuintes, visto que incentivam essa implantação com os tokens. No entanto, o mcap atual é quase inútil, uma vez que já foi emitido.
  • Então, vamos supor que haja outros US$ 80 bilhões (2x o valor existente) de capitalizações de tokens DePIn privadas e públicas chegando ao mercado como incentivos nos próximos 3-5 anos e assumir que isso está indo 100% para casos de uso de IA.

Mesmo que tomemos essa estimativa muito grossa dividida por 3 (anos) e comparemos o valor em dólares disso com o dinheiro vivo gasto apenas pelos Hyperscalers em 2024, fica claro que simplesmente adicionar incentivos de token a um monte de projetos de “rede GPU descentralizada” não é suficiente.

Também é necessário que haja bilhões de dólares em demanda de investidores para absorver esses tokens, já que os operadores dessas redes vendem uma grande parcela das moedas mineradas para cobrir os custos significativos de Cap- e OpEX. E alguns bilhões a mais para impulsionar esses tokens e incentivar o crescimento na expansão para superar os Hyperscalers.

No entanto, alguém com conhecimento íntimo de como a maioria dos servidores Web3 são atualmente executados pode esperar que uma grande parte da "Infraestrutura Física Descentralizada" realmente seja executada nos mesmos serviços de nuvem dos Hiperescalonadores. E, é claro, o aumento na demanda por hardware especializado em GPU e outras IA está impulsionando mais oferta, o que eventualmente deve tornar o aluguel ou compra de nuvem muito mais barato. Pelo menos essa é a expectativa.

Mas também considere isto: neste momento, a NVIDIA precisa priorizar os clientes para suas GPUs de última geração. É também começando a competircom os maiores provedores de nuvem em seu próprio terreno - oferecendo serviços de plataforma de IA aos clientes empresariais que já estão presos a esses Hiperscalers. Isso eventualmente os incentiva a construir seus próprios data centers ao longo do tempo (essencialmente reduzindo as margens de lucro gordo que estão desfrutando no momento, portanto, menos provável) ou limitar significativamente as vendas de hardware de IA apenas aos provedores de nuvem de sua rede de parcerias.

Além disso, concorrentes da NVIDIA que estão lançando hardware adicional especializado em IA estão usando principalmente os mesmos chips que a NVIDIA,produzido pela TSMC.Então, basicamente todas as empresas de hardware de IA estão atualmentecompetindo pela capacidade da TSMC.TSMC também precisa priorizar certos clientes em relação a outros. A Samsung e potencialmente a Intel (que está tentando voltar à fabricação de chips de ponta para seu próprio hardware em breve) podem ser capazes de absorver demanda extra, mas a TSMC está produzindo a maioria dos chips relacionados à IA no momento e escalar e calibrar a fabricação de chips de ponta (3 e 2 nanômetros) leva anos.

Além disso, toda a fabricação de chips de ponta no momento é feita próximo ao Estreito de Taiwan pela TSMC em Taiwan e pela Samsung na Coreia do Sul, onde existe o risco de um conflito militar se materializar antes que as instalações atualmente construídas nos EUA para compensar isso (e também não se espera que produzam os chips da próxima geração por mais alguns anos) possam ser lançadas.

E, finalmente, a China, que está essencialmente cortada do hardware de IA de última geração devido às restrições impostas à NVIDIA e TSMC pelos EUA, está competindo pelo que resta de computação disponível, assim como as redes DePIN da Web3. Ao contrário da Web3, as empresas chinesas realmente têm seus próprios modelos competitivos, especialmente os LLMs da Baidu e Alibaba, que exigem muitos dos dispositivos de geração anterior para funcionar.

Então, existe um risco não-imaterial de que, devido a um dos motivos mencionados acima ou a uma confluência de fatores, os Hyperescaladores limitem o acesso ao seu hardware de IA para partes externas, à medida que a guerra de dominação da IA se intensifica e assume prioridade sobre o negócio de nuvem. Basicamente, é um cenário em que eles ocupam toda a capacidade de nuvem relacionada à IA para seu próprio uso e não a oferecem mais a ninguém, enquanto também absorvem todo o hardware mais recente. Isso acontece e o restante do suprimento de computação se torna ainda mais demandado por outros grandes players, incluindo soberanos. Tudo isso enquanto as GPUs de nível de consumo que restam estão se tornando cada vez menos competitivas.

Obviamente, este é um cenário extremo, mas o prêmio é muito grande para os grandes players recuarem no caso de gargalos de hardware permanecerem. Isso deixa os operadores descentralizados como os data centers de nível 2 e os proprietários de hardware de varejo, que compõem a maioria dos provedores DePIn Web3, de fora da competição.

O Outro Lado da Moeda

Enquanto os fundadores de criptomoedas estão dormindo no volante, os pesos pesados de IA estão observando de perto as criptomoedas.Pressões do governoe a concorrência pode levá-los a adotar criptomoedas para evitar serem fechados ou fortemente regulamentados.

Fundador da Stability AI recentementesaindo do cargopara começar a “descentralizar” sua empresa é uma das primeiras dicas públicas sobre isso. Anteriormente, ele não havia feito segredo de seus planos de lançar um token em aparições públicas, mas somente após a conclusão bem-sucedida do IPO da empresa - o que meio que revela os verdadeiros motivos por trás da mudança antecipada.

Na mesma linha, enquanto Sam Altman não está envolvido operacionalmente com o projeto de criptomoedas que ele co-fundou, Worldcoin, seu token certamente negocia como um proxy para OpenAI. Se existe um caminho para conectaro projeto de dinheiro da internet livre com o projeto de P&D de IA só o tempo dirá, mas a equipe da Worldcoin parece tambémreconhecerque o mercado está testando essa hipótese.

Para nós, faz muito sentido que as gigantes de IA possam explorar caminhos diferentes para a descentralização. O problema que vemos aqui novamente é que o Web3 não produziu soluções significativas. Os "tokens de governança" são em grande parte um meme, enquanto apenas aqueles que evitam explicitamente laços diretos entre detentores de ativos e o desenvolvimento e operações de suas redes - $BTC e $ETH - são os verdadeiramente descentralizados no momento.

Os mesmos incentivos (des) que retardam o desenvolvimento tecnológico também afetam o desenvolvimento de diferentes projetos para governar redes criptográficas. As equipes iniciantes simplesmente colocam um "token de governança" em cima de seu produto na esperança de descobrir como fazer isso à medida que ganham impulso, acabando por se enraizar no "teatro de governança" em torno da alocação de recursos.

Conclusão

A corrida da IA está em andamento e todos estão muito sérios a respeito. Não podemos identificar uma falha no pensamento dos grandes incumbentes de tecnologia quando se trata de escalar seus cálculos a taxas sem precedentes - mais cálculos significam uma IA melhor, uma IA melhor significa redução de custos, adição de novas receitas e expansão da participação de mercado. Isso significa para nós que a bolha é justificada, mas todos os falsos ainda serão eliminados nos inevitáveis reajustes futuros.

Grandes corporações centralizadas de IA estão dominando o campo e as startups legítimas acham difícil acompanhar. O espaço da Web3 demorou a entrar na festa, mas também está entrando na corrida. O mercado está recompensando projetos de IA cripto de forma muito mais rica em comparação com as startups da Web2 no espaço, o que desvia os interesses dos fundadores de lançar o produto para impulsionar o token em um momento crítico em que a janela de oportunidade para alcançar está se fechando rapidamente. Até agora, não houve nenhuma inovação ortogonal aqui que contorne a expansão de computação em grande escala para competir.

Existe agora um movimento de código aberto credível em torno de modelos voltados para o consumidor, que foi originalmente impulsionado com apenas alguns players centralizados optando por competir com maiores rivais de código fechado por participação de mercado (por exemplo, Meta, Stability AI). Mas agora a comunidade está alcançando e pressionando as principais empresas de IA. Essas pressões continuarão a afetar o desenvolvimento de produtos de IA de código fechado, mas não de forma significativa até que o código aberto esteja do lado alcançando. Esta é outra grande oportunidade para o espaço Web3, mas somente se resolver o treinamento e inferência de modelo descentralizados.

Assim, enquanto, superficialmente, as aberturas 'clássicas' para disruptores estão presentes, a realidade não poderia ser mais desfavorável a eles. A IA está predominantemente ligada ao cálculo e não há nada que possa ser alterado a respeito, a menos que haja uma inovação revolucionária nos próximos 3-5 anos, que é um período crucial para determinar quem controla e direciona o desenvolvimento da IA.

O próprio mercado de computação, embora a demanda esteja impulsionando os esforços do lado da oferta, também não pode "deixar cem flores desabrocharem" com a competição entre os fabricantes limitada por fatores estruturais como fabricação de chips e economias de escala.

Permanecemos otimistas em relação à engenhosidade humana e temos certeza de que há pessoas inteligentes e nobres o suficiente para tentar resolver o problema da IA de uma forma que favoreça o mundo livre em vez do controle corporativo ou governamental de cima para baixo. Mas as chances estão parecendo muito pequenas e é uma questão de sorte no máximo, mas os fundadores do Web3 estão ocupados demais lançando a moeda para obter impacto financeiro em vez de impacto no mundo real.

Se você está construindo algo legal para ajudar a aumentar as chances do Web3 e não está apenas surfando na onda de hype, entre em contato conosco.

Aviso legal:

  1. Este artigo é reproduzido a partir de [Gategagra.vc], Todos os direitos autorais pertencem ao autor original [gagra.vc]. Se houver objeções a esta reimpressão, entre em contato com o Gate Aprendaequipe e eles vão lidar com isso prontamente.
  2. Isenção de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem qualquer conselho de investimento.
  3. As traduções do artigo para outros idiomas são feitas pela equipe Gate Learn. Salvo menção em contrário, copiar, distribuir ou plagiar os artigos traduzidos é proibido.

Virando a Moeda de IA

iniciantes5/6/2024, 12:41:32 PM
O artigo explora o potencial e os desafios de combinar IA com Web3. O autor aponta que, apesar do sentimento otimista em relação a "IA + Web3," existem barreiras significativas de investimento em hardware e pesquisa na realidade, levando a grandes empresas de tecnologia dominando o campo da IA. Os projetos Web3 utilizam crowdsourcing incentivado por meio de criptografia, tornando difícil competir com o financiamento substancial investido por essas empresas.

TLDR

Este não é outro artigo otimista de VC sobre “AI + Web3”. Estamos otimistas sobre a fusão de ambas as tecnologias, mas o texto abaixo é um chamado às armas. Caso contrário, o otimismo não acabará justificado.

Porquê? Porque desenvolver e executar os melhores modelos de IA requer despesas de capital significativas no hardware mais avançado e muitas vezes difícil de obter, bem como P&D muito específico do domínio. Atribuir incentivos cripto para obter esses recursos, como a maioria dos projetos de IA Web3 está fazendo, não é suficiente para superar dezenas de bilhões de dólares investidos por grandes corporações que controlam o desenvolvimento de IA de forma firme. Dadas as restrições de hardware, este pode ser o primeiro grande paradigma de software que engenheiros inteligentes e criativos fora das organizações incumbentes não têm recursos para desafiar.

O software está "devorando o mundo" cada vez mais rápido, prestes a decolar exponencialmente com a aceleração da IA. E todo esse "bolo", com a situação atual, está indo para as grandes empresas de tecnologia - enquanto os usuários finais, incluindo governos e grandes empresas, sem falar nos consumidores, ficam ainda mais dependentes de seu poder.

Desalinhamento de incentivos

Tudo isso não poderia ter se desenrolado em um momento mais inadequado - com 90% dos participantes da web descentralizada ocupados perseguindo a galinha dos gansos de ouro do desenvolvimento orientado pela narrativa. Sim, os desenvolvedores estão seguindo os investidores em nosso setor e não o contrário. Varia de admissão aberta a motivação mais sutil e subconsciente, mas as narrativas e os mercados que se formam em torno delas impulsionam muitas tomadas de decisão na Web3. Os participantes estão muito engolfados em uma bolha reflexiva clássica para perceber o mundo lá fora, exceto por narrativas que ajudam a avançar ainda mais esse ciclo. E a IA é obviamente a maior, já que também está passando por um boom próprio.

Conversamos com dezenas de equipes na interseção da IA x Cripto e podemos confirmar que muitas delas são muito capazes, orientadas por missão e construtores apaixonados. Mas tal é a natureza humana que, quando confrontados com tentações, tendemos a sucumbir a elas e então racionalizar essas escolhas pós-fato.

O caminho fácil para a liquidez tem sido uma maldição histórica da indústria de criptomoedas - responsável por retardar seu desenvolvimento e adoção útil por anos neste ponto. Isso desvia até os discípulos de criptomoedas mais fiéis para "bombar o token". A justificativa é que, com mais capital em mãos na forma de tokens, esses construtores podem ter melhores chances.

Relativamente baixa sofisticação de capital institucional e de varejo cria oportunidades para os construtores fazerem reivindicações desconectadas da realidade, enquanto ainda se beneficiam de valorações como se essas reivindicações já tivessem se concretizado. O resultado desses processos é um risco moral e destruição de capital efetivamente arraigados, com muito poucas dessas estratégias funcionando a longo prazo. A necessidade é a mãe de todas as invenções e quando ela se vai, também se vão as invenções.

Não poderia ter acontecido em pior momento. Enquanto todos os empreendedores de tecnologia mais inteligentes, atores estatais e empresas, grandes e pequenas, estão correndo para garantir sua parcela de benefícios provenientes da revolução da IA, os fundadores e investidores de criptomoedas estão optando por um "rápido 10x". Em vez de uma vida inteira de 1000 x, que é o verdadeiro custo de oportunidade aqui, na nossa visão.

Um Resumo Geral da Paisagem da IA Web3

Dadas as incentivos mencionados acima, a taxonomia do projeto de IA Web3 realmente se resume a:

  • Legítimo (também subdividido entre realistas e idealistas)
  • Semi-legítimo e
  • Falsificadores

Basicamente, achamos que os construtores sabem exatamente o que é necessário para acompanhar sua concorrência Web2 e os verticais onde é realmente possível competir e onde é mais um sonho distante, mas que ainda é possível vender para VCs e público não sofisticado.

O objetivo é poder competir aqui e agora. Caso contrário, a velocidade do desenvolvimento da IA pode deixar o Web3 para trás, enquanto o mundo salta para o distópico Web4 da IA corporativa no Ocidente versus a IA estatal da China. Aqueles que não podem ser competitivos em breve e dependem da tecnologia distribuída para alcançar ao longo do tempo são muito otimistas para serem levados a sério.

Obviamente, esta é uma generalização muito grosseira e até o grupo falso contém pelo menos algumas equipes sérias (e talvez mais apenas sonhadores delirantes). Mas este texto é um apelo às armas, então não pretendemos ser objetivos, mas sim apelar ao senso de urgência do leitor[1].

Legítimo:

  • Middleware para "trazer AI para a blockchain". Os fundadores por trás dessas soluções, que não são muitos, entendem que o treinamento descentralizado ou inferência de modelos que os usuários realmente desejam (o estado-da-arte) é inviável, senão impossível no momento. Portanto, encontrar uma maneira de conectar os melhores modelos centralizados com o ambiente da blockchain para permitir que ela se beneficie da automação sofisticada é um bom primeiro passo para eles. Enclaves de hardware TEEs(processadores ‘air-gapped’) que podem hospedar pontos de acesso da API, oráculos de 2 lados (para indexar dados on e off-chain bidirecionalmente) e fornecer ambientes de computação off-chain verificáveis para os agentes, parecem ser a melhor solução no momento. Também existem arquiteturas de co-processador que usam provas de conhecimento zero (ZKPs) para capturar alterações de estado (em vez de verificar a computação completa) que também consideramos viáveis a médio prazo.
    A abordagem mais idealista para o mesmo problema tenta verificar a inferência off-chain para equipará-la à computação on-chain em termos de pressupostos de confiança. O objetivo disso deve ser permitir que a IA execute tarefas on e off-chain em um ambiente de execução coeso, em nossa opinião. No entanto, a maioria dos defensores da verificabilidade da inferência falam sobre "confiar nos pesos do modelo" e outros objetivos complicados do mesmo tipo que se tornam relevantes em anos, se é que se tornam. Recentemente, os fundadores deste grupo começaram a explorarabordagens alternativaspara verificabilidade de inferência, mas originalmente era baseado em ZKP. Enquanto muitas equipes inteligentes estão trabalhando em ZKML, como passou a ser conhecido, eles estão correndo um risco muito grande ao antecipar que as otimizações criptográficas superam a complexidade e os requisitos de computação dos modelos de IA. Portanto, consideramos que eles não estão aptos para competir, pelo menos por enquanto. Ainda, @ModulusLabs/capítulo-14-o-primeiro-llm-on-chain-do-mundo-7e389189f85e">alguns progressos recentes são interessantes e não devem ser ignorados.

Semi-legítimo:

  • Aplicativos de consumidor que usam invólucros em torno de modelos de código fechado e aberto (por exemplo, Stable Diffusion ou Midjourney para geração de imagens). Algumas dessas equipes são as primeiras no mercado e têm tração real do usuário. Portanto, não é justo chamá-los genericamente de falsos, mas há apenas alguns que estão pensando profundamente sobre como evoluir seus modelos subjacentes de forma descentralizada e inovar no design de incentivos. Existem algumas abordagens interessantes de governança/propriedade no componente de token aqui e ali. Mas a maioria dos projetos nesta categoria simplesmente adiciona um token a um invólucro centralizado, por exemplo, na API da OpenAI, para obter um prêmio de valuation ou liquidez mais rápida para a equipe.

O que nenhum dos dois campos acima aborda é o treinamento e inferência para modelos grandes em configurações descentralizadas. Atualmente, não há maneira de treinar um modelo fundamental em um tempo razoável sem depender de clusters de hardware fortemente conectados. O "tempo razoável", dado o nível de competição, é o fator chave.

Algum pesquisa promissorasobre o tópico surgiu recentemente e, teoricamente, abordagens como Fluxo de Dados Diferencialpode ser expandido para redes de computação distribuída para aumentar sua capacidade no futuro (à medida que as capacidades de rede acompanham os requisitos de fluxo de dados). Mas o treinamento de modelo competitivo ainda requer comunicação entre clusters localizados, em vez de dispositivos distribuídos individuais, e computação de ponta (as GPUs de varejo estão se tornando cada vez mais não competitivas).

A pesquisa sobre a localização (uma das duas formas de descentralização) da inferência através da redução do tamanho do modelo também foiprogredindo recentemente, mas não existem protocolos existentes no Web3 que o aproveitem.

Os problemas com treinamento e inferência descentralizados logicamente nos levam ao último dos três campos e de longe o mais importante e, portanto, tão emocionalmente desencadeador para nós ;-)

Fakers:

  • Aplicativos de infraestrutura principalmente no espaço de servidor descentralizado, oferecendo hardware básico ou também ambientes de treinamento/hospedagem de modelo descentralizado. Também existem projetos de infraestrutura de software que estão promovendo protocolos, por exemplo, aprendizado federado (treinamento de modelo descentralizado) ou aqueles que combinam os componentes de software e hardware em uma única plataforma, onde é essencialmente possível treinar e implantar seu modelo descentralizado de ponta a ponta. A maioria deles carece da sofisticação necessária para realmente abordar os problemas declarados e prevalece aqui o pensamento ingênuo de “incentivo de token + vento de mercado”. Nenhuma das soluções que vimos nos mercados público e privado se aproxima de uma competição significativa aqui e agora. Alguns podem evoluir para ofertas viáveis (mas de nicho), mas precisamos de algo novo e competitivo aqui e agora. E isso só pode acontecer por meio de um design inovador que aborda gargalos de computação distribuída. No treinamento, não apenas a velocidade, mas também a verificabilidade do trabalho realizado e a coordenação das cargas de trabalho de treinamento são um grande problema, o que contribui para o gargalo de largura de banda.

Precisamos de um conjunto de modelos fundamentais competitivos e verdadeiramente descentralizados e eles requerem treinamento e inferência descentralizados para funcionar. Perder a IA pode negar completamente qualquer conquista feita desde a chegada do Ethereum pelos "computadores mundiais descentralizados". Se os computadores se tornarem IA e a IA for centralizada, não haverá computador mundial para falar, exceto alguma versão distópica disso.

Treinamento e inferência são o coração da inovação em IA. Quando o restante do mundo da IA está se movendo em direção a arquiteturas mais coesas, a Web3 precisa de alguma solução ortogonal para competir, porque competir de frente está se tornando menos viável muito rapidamente.

Tamanho do Problema

Tudo se resume a computação. Quanto mais você usar tanto no treinamento quanto na inferência, melhores serão seus resultados. Sim, há ajustes e otimizações aqui e ali e a própria computação não é homogênea - agora há uma variedade de novas abordagens para superar os gargalos da arquitetura tradicional de Von Neumann para unidades de processamento - mas ainda assim tudo se resume a quantas multiplicações de matriz você pode fazer em relação ao tamanho de um bloco de memória e à velocidade com que pode fazê-las.

É por isso que estamos testemunhando uma construção tão forte na frente dos data centers pelos chamados 'Hyperscalers', que estão todos procurando criar uma pilha completa com um modelo de IA poderoso no topo e hardware que o alimenta por baixo: OpenAI (modelos) + Microsoft (computação), Anthropic (modelos) + AWS (computação), Google (ambos) e Meta (cada vez mais ambos por meio de um aumento na construção de seus próprios data centers). Existem mais nuances, dinâmicas de interação e partes envolvidas, mas vamos deixar de fora. O quadro geral é que os Hyperscalers estão investindo bilhões de dólares, como nunca antes, na construção de data centers e estão criando sinergias entre suas ofertas de computação e IA, esperando gerar enormes lucros à medida que a IA se espalha pela economia global.

Vamos apenas olhar para o nível de construção esperado apenas este ano pelas 4 empresas:

  • Meta antecipa $30-37bndespesas de capital em 2024, que provavelmente estarão fortemente inclinadas para centros de dados.
  • Microsoft gastou cerca de $11.5 bilhões em 2023em CapEx e é amplamente rumorado para investir mais $40-50bn em ‘24-‘25! Isso pode ser parcialmente inferido pelos enormes investimentos em data centers sendo anunciados em apenas alguns países isolados: $3.2bno Reino Unido, $3.5bnna Austrália, $2.1bnem Espanha, €3.2bnna Alemanha,$1bnno estado americano da Geórgia e$10bnem Wisconsin, respectivamente. E esses são apenas alguns dos investimentos regionais de sua rede de 300 data centers abrangendo 60+ regiões. Há tambémconversas de um supercomputador para OpenAI que pode custar à Microsoft mais US $ 100 bilhões!
  • Liderança da Amazonesperaseu CapEx deve crescer significativamente em 2024 a partir dos $48 bilhões que gastaram em 2023, impulsionado principalmente pela expansão da infraestrutura da AWS para construção de IA.
  • Google gastou $11bnpara ampliar seus servidores e centros de dados apenas no quarto trimestre de 2023. Eles admitem que esses investimentos foram feitos para atender à demanda esperada de IA e estão prevendo que a taxa e o tamanho total de seus gastos com infraestrutura aumentem significativamente em 2024 devido à IA.

E assim foi gasto em hardware de IA da NVIDIA apenas em 2023:

Jensen Huang, CEO da NVIDIA, tem lançado um total de US$ 1 trilhão para ser investido na aceleração de IA nos próximos anos. Uma previsão que ele fez recentemente dobradopara $2tn, alegadamente provocado pelo interesse que testemunhou por parte dos players soberanos. Os analistas da Altimeter esperam um gasto de $160bn e mais de $200bn em data centers relacionados com IA a nível global em ‘24 e ‘25, respectivamente.

Agora, comparar esses números com o que o Web3 tem a oferecer aos operadores de centro de dados independentes para incentivá-los a expandir CapEx em hardware de IA mais recente:

  • O valor de mercado total de todos os projetos de Infraestrutura Física Descentralizada (DePIn) está atualmente em torno de $40bn em tokens relativamente ilíquidos e predominantemente especulativos. Essencialmente, os market caps dessas redes são iguais à estimativa do limite superior do total de CapEx de seus contribuintes, visto que incentivam essa implantação com os tokens. No entanto, o mcap atual é quase inútil, uma vez que já foi emitido.
  • Então, vamos supor que haja outros US$ 80 bilhões (2x o valor existente) de capitalizações de tokens DePIn privadas e públicas chegando ao mercado como incentivos nos próximos 3-5 anos e assumir que isso está indo 100% para casos de uso de IA.

Mesmo que tomemos essa estimativa muito grossa dividida por 3 (anos) e comparemos o valor em dólares disso com o dinheiro vivo gasto apenas pelos Hyperscalers em 2024, fica claro que simplesmente adicionar incentivos de token a um monte de projetos de “rede GPU descentralizada” não é suficiente.

Também é necessário que haja bilhões de dólares em demanda de investidores para absorver esses tokens, já que os operadores dessas redes vendem uma grande parcela das moedas mineradas para cobrir os custos significativos de Cap- e OpEX. E alguns bilhões a mais para impulsionar esses tokens e incentivar o crescimento na expansão para superar os Hyperscalers.

No entanto, alguém com conhecimento íntimo de como a maioria dos servidores Web3 são atualmente executados pode esperar que uma grande parte da "Infraestrutura Física Descentralizada" realmente seja executada nos mesmos serviços de nuvem dos Hiperescalonadores. E, é claro, o aumento na demanda por hardware especializado em GPU e outras IA está impulsionando mais oferta, o que eventualmente deve tornar o aluguel ou compra de nuvem muito mais barato. Pelo menos essa é a expectativa.

Mas também considere isto: neste momento, a NVIDIA precisa priorizar os clientes para suas GPUs de última geração. É também começando a competircom os maiores provedores de nuvem em seu próprio terreno - oferecendo serviços de plataforma de IA aos clientes empresariais que já estão presos a esses Hiperscalers. Isso eventualmente os incentiva a construir seus próprios data centers ao longo do tempo (essencialmente reduzindo as margens de lucro gordo que estão desfrutando no momento, portanto, menos provável) ou limitar significativamente as vendas de hardware de IA apenas aos provedores de nuvem de sua rede de parcerias.

Além disso, concorrentes da NVIDIA que estão lançando hardware adicional especializado em IA estão usando principalmente os mesmos chips que a NVIDIA,produzido pela TSMC.Então, basicamente todas as empresas de hardware de IA estão atualmentecompetindo pela capacidade da TSMC.TSMC também precisa priorizar certos clientes em relação a outros. A Samsung e potencialmente a Intel (que está tentando voltar à fabricação de chips de ponta para seu próprio hardware em breve) podem ser capazes de absorver demanda extra, mas a TSMC está produzindo a maioria dos chips relacionados à IA no momento e escalar e calibrar a fabricação de chips de ponta (3 e 2 nanômetros) leva anos.

Além disso, toda a fabricação de chips de ponta no momento é feita próximo ao Estreito de Taiwan pela TSMC em Taiwan e pela Samsung na Coreia do Sul, onde existe o risco de um conflito militar se materializar antes que as instalações atualmente construídas nos EUA para compensar isso (e também não se espera que produzam os chips da próxima geração por mais alguns anos) possam ser lançadas.

E, finalmente, a China, que está essencialmente cortada do hardware de IA de última geração devido às restrições impostas à NVIDIA e TSMC pelos EUA, está competindo pelo que resta de computação disponível, assim como as redes DePIN da Web3. Ao contrário da Web3, as empresas chinesas realmente têm seus próprios modelos competitivos, especialmente os LLMs da Baidu e Alibaba, que exigem muitos dos dispositivos de geração anterior para funcionar.

Então, existe um risco não-imaterial de que, devido a um dos motivos mencionados acima ou a uma confluência de fatores, os Hyperescaladores limitem o acesso ao seu hardware de IA para partes externas, à medida que a guerra de dominação da IA se intensifica e assume prioridade sobre o negócio de nuvem. Basicamente, é um cenário em que eles ocupam toda a capacidade de nuvem relacionada à IA para seu próprio uso e não a oferecem mais a ninguém, enquanto também absorvem todo o hardware mais recente. Isso acontece e o restante do suprimento de computação se torna ainda mais demandado por outros grandes players, incluindo soberanos. Tudo isso enquanto as GPUs de nível de consumo que restam estão se tornando cada vez menos competitivas.

Obviamente, este é um cenário extremo, mas o prêmio é muito grande para os grandes players recuarem no caso de gargalos de hardware permanecerem. Isso deixa os operadores descentralizados como os data centers de nível 2 e os proprietários de hardware de varejo, que compõem a maioria dos provedores DePIn Web3, de fora da competição.

O Outro Lado da Moeda

Enquanto os fundadores de criptomoedas estão dormindo no volante, os pesos pesados de IA estão observando de perto as criptomoedas.Pressões do governoe a concorrência pode levá-los a adotar criptomoedas para evitar serem fechados ou fortemente regulamentados.

Fundador da Stability AI recentementesaindo do cargopara começar a “descentralizar” sua empresa é uma das primeiras dicas públicas sobre isso. Anteriormente, ele não havia feito segredo de seus planos de lançar um token em aparições públicas, mas somente após a conclusão bem-sucedida do IPO da empresa - o que meio que revela os verdadeiros motivos por trás da mudança antecipada.

Na mesma linha, enquanto Sam Altman não está envolvido operacionalmente com o projeto de criptomoedas que ele co-fundou, Worldcoin, seu token certamente negocia como um proxy para OpenAI. Se existe um caminho para conectaro projeto de dinheiro da internet livre com o projeto de P&D de IA só o tempo dirá, mas a equipe da Worldcoin parece tambémreconhecerque o mercado está testando essa hipótese.

Para nós, faz muito sentido que as gigantes de IA possam explorar caminhos diferentes para a descentralização. O problema que vemos aqui novamente é que o Web3 não produziu soluções significativas. Os "tokens de governança" são em grande parte um meme, enquanto apenas aqueles que evitam explicitamente laços diretos entre detentores de ativos e o desenvolvimento e operações de suas redes - $BTC e $ETH - são os verdadeiramente descentralizados no momento.

Os mesmos incentivos (des) que retardam o desenvolvimento tecnológico também afetam o desenvolvimento de diferentes projetos para governar redes criptográficas. As equipes iniciantes simplesmente colocam um "token de governança" em cima de seu produto na esperança de descobrir como fazer isso à medida que ganham impulso, acabando por se enraizar no "teatro de governança" em torno da alocação de recursos.

Conclusão

A corrida da IA está em andamento e todos estão muito sérios a respeito. Não podemos identificar uma falha no pensamento dos grandes incumbentes de tecnologia quando se trata de escalar seus cálculos a taxas sem precedentes - mais cálculos significam uma IA melhor, uma IA melhor significa redução de custos, adição de novas receitas e expansão da participação de mercado. Isso significa para nós que a bolha é justificada, mas todos os falsos ainda serão eliminados nos inevitáveis reajustes futuros.

Grandes corporações centralizadas de IA estão dominando o campo e as startups legítimas acham difícil acompanhar. O espaço da Web3 demorou a entrar na festa, mas também está entrando na corrida. O mercado está recompensando projetos de IA cripto de forma muito mais rica em comparação com as startups da Web2 no espaço, o que desvia os interesses dos fundadores de lançar o produto para impulsionar o token em um momento crítico em que a janela de oportunidade para alcançar está se fechando rapidamente. Até agora, não houve nenhuma inovação ortogonal aqui que contorne a expansão de computação em grande escala para competir.

Existe agora um movimento de código aberto credível em torno de modelos voltados para o consumidor, que foi originalmente impulsionado com apenas alguns players centralizados optando por competir com maiores rivais de código fechado por participação de mercado (por exemplo, Meta, Stability AI). Mas agora a comunidade está alcançando e pressionando as principais empresas de IA. Essas pressões continuarão a afetar o desenvolvimento de produtos de IA de código fechado, mas não de forma significativa até que o código aberto esteja do lado alcançando. Esta é outra grande oportunidade para o espaço Web3, mas somente se resolver o treinamento e inferência de modelo descentralizados.

Assim, enquanto, superficialmente, as aberturas 'clássicas' para disruptores estão presentes, a realidade não poderia ser mais desfavorável a eles. A IA está predominantemente ligada ao cálculo e não há nada que possa ser alterado a respeito, a menos que haja uma inovação revolucionária nos próximos 3-5 anos, que é um período crucial para determinar quem controla e direciona o desenvolvimento da IA.

O próprio mercado de computação, embora a demanda esteja impulsionando os esforços do lado da oferta, também não pode "deixar cem flores desabrocharem" com a competição entre os fabricantes limitada por fatores estruturais como fabricação de chips e economias de escala.

Permanecemos otimistas em relação à engenhosidade humana e temos certeza de que há pessoas inteligentes e nobres o suficiente para tentar resolver o problema da IA de uma forma que favoreça o mundo livre em vez do controle corporativo ou governamental de cima para baixo. Mas as chances estão parecendo muito pequenas e é uma questão de sorte no máximo, mas os fundadores do Web3 estão ocupados demais lançando a moeda para obter impacto financeiro em vez de impacto no mundo real.

Se você está construindo algo legal para ajudar a aumentar as chances do Web3 e não está apenas surfando na onda de hype, entre em contato conosco.

Aviso legal:

  1. Este artigo é reproduzido a partir de [Gategagra.vc], Todos os direitos autorais pertencem ao autor original [gagra.vc]. Se houver objeções a esta reimpressão, entre em contato com o Gate Aprendaequipe e eles vão lidar com isso prontamente.
  2. Isenção de Responsabilidade: As opiniões expressas neste artigo são exclusivamente do autor e não constituem qualquer conselho de investimento.
  3. As traduções do artigo para outros idiomas são feitas pela equipe Gate Learn. Salvo menção em contrário, copiar, distribuir ou plagiar os artigos traduzidos é proibido.
Lancez-vous
Inscrivez-vous et obtenez un bon de
100$
!