À medida que as aplicações de IA penetram em várias indústrias, a avaliação precisa do desempenho do modelo e o aumento da confiança do usuário tornaram-se questões urgentes. As avaliações tradicionais muitas vezes dependem de mecanismos centralizados, dificultando a cobertura de cenários diversos e falhando em refletir as verdadeiras preferências dos usuários; ao mesmo tempo, o problema da "alucinação" do modelo surge com frequência, fazendo com que os usuários frequentemente caiam em silos de informação ao fazer escolhas.
Nesse contexto, Yupp, como uma nova plataforma, está tentando remodelar a descoberta, comparação e utilização de modelos de IA com seu modelo exclusivo de crowdsourcing e mecanismo de incentivo, trazendo uma mudança de paradigma para o campo da avaliação de IA. Este artigo irá aprofundar os mecanismos centrais da Yupp, destaques técnicos, histórico da equipe e seu potencial impacto no ecossistema de IA.
Yupp está focado em resolver os desafios de avaliação de longa data no campo da IA, dedicado a construir um mercado de feedback de IA "sem confiança"—permitindo que o feedback diversificado dos usuários circule livremente sob a proteção do blockchain e incentivos criptoeconômicos, formando assim uma camada de avaliação de modelo escalável, justa e transparente. Ao incentivar a distribuição de dados de alta qualidade anotados manualmente, a Yupp pode capturar prontamente as reais necessidades e preferências dos usuários em diferentes cenários, ajudando os desenvolvedores de IA a otimizar o desempenho do modelo de maneira iterativa.
O projeto foi fundado em junho de 2024 por Pankaj Gupta (Co-fundador e CEO) e Gilad Mishne (Co-fundador e Chefe de IA), com o Cientista Chefe Jimmy Lin (Professor na Universidade de Waterloo) também participando da equipe principal. Os três haviam trabalhado juntos no Twitter em 2010, onde construíram e otimizaram sistemas de recomendação e busca em larga escala, e depois ganharam ampla experiência no Google e na Coinbase.
Devido à sua visão de descentralização e transparência do valor dos dados, que pode atender às demandas duplas dos fabricantes de IA por avaliação confiável e participação do usuário, assim como se beneficiar da rica experiência de sua equipe central, a Yupp ganhou alto reconhecimento de figuras conhecidas na indústria de tecnologia e dos principais capitalistas de risco.
Na semana passada, a Yupp anunciou a conclusão de uma rodada de sementes de $33 milhões, liderada pelo parceiro da A16z, Chris Dixon. Outros investidores incluem o Cientista Chefe do Google, Jeff Dean, o cofundador do Twitter, Biz Stone, o cofundador do Pinterest, Evan Sharp, o CEO da Perplexity, Aravind Srinivas, Dan Boneh da Universidade de Stanford, Chris Re, Nick McKeown e Balaji Prabhakar, entre 45 anjos conhecidos e executivos corporativos, além da Coinbase Ventures.
Como uma plataforma de avaliação de IA centralizada, Yupp adere à filosofia de “Toda IA para todos”, permitindo que os usuários descubram, comparem e utilizem facilmente os mais recentes modelos de IA. Ao contrário das respostas únicas tradicionais, Yupp retorna respostas de dois (ou até mais) modelos simultaneamente para cada solicitação, formando um “parlamento de IA”. Este design não só atende à demanda dos usuários por escolhas diversificadas, mas também identifica efetivamente potenciais “alucinações” que os modelos podem produzir, ajudando os usuários a tomar decisões mais informadas por meio da comparação. Como afirmou o CEO da Yupp, Pankaj Gupta, as saídas lado a lado são particularmente benéficas para os usuários preocupados com erros de geração, pois eles podem verificar os resultados.
A plataforma agora suporta mais de 500 modelos de IA, cobrindo os campos de geração de texto e imagem, incluindo modelos bem conhecidos como ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama e muitos modelos emergentes. Para otimizar ainda mais a experiência, a Yupp também lançou o recurso "QuickTake", que pode destilar respostas longas em um tweet conciso.
Além disso, a Yupp dá alta prioridade à privacidade do usuário: todos os registros de chat são privados por padrão, a menos que o usuário os torne públicos ativamente; mesmo quando compartilhados publicamente, nenhuma informação pessoal é divulgada. Os usuários podem controlar o conteúdo e o escopo do compartilhamento a qualquer momento.
Yupp usará o feedback dos usuários gratuitamente e medirá o uso do modelo através do sistema de “Yupp Points”. Novos usuários recebem 5000 pontos ao se registrarem e podem ganhar mais pontos avaliando as respostas do modelo, selecionando preferências e explicando suas razões. Quanto maior a qualidade do feedback, maiores as recompensas, garantindo que os usuários possam usar de forma sustentável modelos de alto nível como Claude Opus 4 ou OpenAI o3 gratuitamente. A plataforma promete que os pontos só aumentarão e que todos os modelos atuais podem ser experimentados gratuitamente.
Após cada pergunta, os usuários receberão duas respostas modelo e poderão ganhar um "cartão de raspadinha digital" por meio de feedback, recompensando pontos Yupp que variam de 0 a 250. A cada 1000 pontos, pode-se trocar por 1 dólar, com um limite máximo de retirada diária de 10 dólares e um limite mensal máximo de 50 dólares. Os pontos podem ser trocados por mais de 20 moedas, incluindo dólares e euros, com parceiros como Stripe, PayPal e Coinbase. Ao mesmo tempo, a plataforma integra Base Ethernet L2 e stablecoins da Solana para fornecer aos usuários globais recompensas instantâneas e sem taxas.
Como Pankaj Gupta disse, o feedback de alta qualidade gerado pelos usuários é muito mais valioso para o ajuste fino dos modelos e o aprendizado por reforço das empresas de IA do que as recompensas em si. Embora os ganhos mensais dos usuários possam ser equivalentes a apenas algumas xícaras de café, esses dados de anotação pagos são cruciais para a iteração da IA.
Para incentivar mais pessoas a participar, a Yupp também estabeleceu uma recompensa por indicação: o indicante recebe 5000 pontos, e a pessoa indicada recebe 1000 pontos; atualmente, novos usuários registrados podem receber 5000 pontos, e a pessoa indicada recebe adicionalmente 2500 pontos.
Para abordar os problemas existentes de transparência insuficiente nas classificações, falta de justiça e acesso desigual aos dados de avaliação, a Yupp lançou uma versão beta do ranking de IA e do sistema de classificação “Yupp VIBE (Vibe Intelligence Benchmark) Score”. Este sistema agrega dados de preferência gerados por usuários globais em interações naturais, visando fornecer resultados de avaliação robustos e confiáveis.
Os princípios de avaliação da Yupp incluem:
A plataforma não apenas coleta preferências binárias, mas também incentiva os usuários a apontar as vantagens e desvantagens das respostas (como "direto ao ponto", "velocidade rápida", "bom estilo", etc.), e realiza análise de cluster com base na idade, educação, ocupação e outras informações dos usuários para mostrar as diferenças de preferência entre diferentes grupos.
Em nível técnico, Yupp está explorando o uso de Blockchain, primitivos criptográficos e provas de conhecimento zero para garantir que o processo de avaliação seja justo, transparente e verificável. Ao mesmo tempo, a plataforma fez parceria com fornecedores profissionais de dados de IA para calibrar avaliadores por meio de verificação arquivística e detecção de qualidade em múltiplas camadas para eliminar dados maliciosos.
A lista de classificação recente foi atualizada, exibindo os scores VIBE de modelos como GPT‑4.5 Preview, Claude Opus 4 e Claude Sonnet 4, juntamente com suas taxas de vitória, taxas de deslike, velocidade, latência, janela de contexto e métricas de custo.
Yupp foi oficialmente lançado em 13 de junho de 2025, após seis meses de testes internos. Desde seu lançamento, o produto tem sido continuamente iterado:
A missão da Yupp é "capacitar a humanidade a moldar o futuro da IA." Pankaj Gupta acredita que o desenvolvimento da IA requer a participação e contribuição de todos. Através de respostas de IA de múltiplas perspectivas e feedback dos usuários, a Yupp não apenas ajuda os usuários a tomarem melhores decisões, mas também fornece uma força motriz contínua para a evolução da IA.
Vale a pena mencionar que um dos principais concorrentes da Yupp é a plataforma de avaliação de modelos de IA aberta LMArena (site:https://lmarena.ai/),O site é muito popular entre profissionais de IA, mas a plataforma está atualmente na fase de exploração comercial e não oferece recompensas materiais diretas ou mecanismos de incentivo de pontos para a participação do usuário, aproveitando a tecnologia Blockchain.
No geral, Yupp abriu um novo caminho para a avaliação de IA com seu modelo de crowdsourcing, mecanismo de incentivo e sistema de avaliação impulsionado pelas preferências reais dos usuários. Ele não apenas oferece aos usuários uma experiência interativa de IA gratuita e diversificada, mas também converte o feedback dos usuários em dados de treinamento de alto valor, promovendo a otimização contínua do modelo. Com uma equipe experiente e um respaldo de capital de primeira linha, espera-se que Yupp desempenhe um papel fundamental no futuro ecossistema de IA, realizando a visão de "IA para todos, moldada por todos."
No entanto, para o Yupp, que acaba de ser lançado, como garantir continuamente a qualidade dos dados, resistir a potenciais comportamentos de trapaça sob a participação de um grande número de usuários e encontrar um equilíbrio entre a comercialização e os incentivos dos usuários ainda será uma direção que precisa ser explorada e otimizada em seu desenvolvimento futuro.
À medida que as aplicações de IA penetram em várias indústrias, a avaliação precisa do desempenho do modelo e o aumento da confiança do usuário tornaram-se questões urgentes. As avaliações tradicionais muitas vezes dependem de mecanismos centralizados, dificultando a cobertura de cenários diversos e falhando em refletir as verdadeiras preferências dos usuários; ao mesmo tempo, o problema da "alucinação" do modelo surge com frequência, fazendo com que os usuários frequentemente caiam em silos de informação ao fazer escolhas.
Nesse contexto, Yupp, como uma nova plataforma, está tentando remodelar a descoberta, comparação e utilização de modelos de IA com seu modelo exclusivo de crowdsourcing e mecanismo de incentivo, trazendo uma mudança de paradigma para o campo da avaliação de IA. Este artigo irá aprofundar os mecanismos centrais da Yupp, destaques técnicos, histórico da equipe e seu potencial impacto no ecossistema de IA.
Yupp está focado em resolver os desafios de avaliação de longa data no campo da IA, dedicado a construir um mercado de feedback de IA "sem confiança"—permitindo que o feedback diversificado dos usuários circule livremente sob a proteção do blockchain e incentivos criptoeconômicos, formando assim uma camada de avaliação de modelo escalável, justa e transparente. Ao incentivar a distribuição de dados de alta qualidade anotados manualmente, a Yupp pode capturar prontamente as reais necessidades e preferências dos usuários em diferentes cenários, ajudando os desenvolvedores de IA a otimizar o desempenho do modelo de maneira iterativa.
O projeto foi fundado em junho de 2024 por Pankaj Gupta (Co-fundador e CEO) e Gilad Mishne (Co-fundador e Chefe de IA), com o Cientista Chefe Jimmy Lin (Professor na Universidade de Waterloo) também participando da equipe principal. Os três haviam trabalhado juntos no Twitter em 2010, onde construíram e otimizaram sistemas de recomendação e busca em larga escala, e depois ganharam ampla experiência no Google e na Coinbase.
Devido à sua visão de descentralização e transparência do valor dos dados, que pode atender às demandas duplas dos fabricantes de IA por avaliação confiável e participação do usuário, assim como se beneficiar da rica experiência de sua equipe central, a Yupp ganhou alto reconhecimento de figuras conhecidas na indústria de tecnologia e dos principais capitalistas de risco.
Na semana passada, a Yupp anunciou a conclusão de uma rodada de sementes de $33 milhões, liderada pelo parceiro da A16z, Chris Dixon. Outros investidores incluem o Cientista Chefe do Google, Jeff Dean, o cofundador do Twitter, Biz Stone, o cofundador do Pinterest, Evan Sharp, o CEO da Perplexity, Aravind Srinivas, Dan Boneh da Universidade de Stanford, Chris Re, Nick McKeown e Balaji Prabhakar, entre 45 anjos conhecidos e executivos corporativos, além da Coinbase Ventures.
Como uma plataforma de avaliação de IA centralizada, Yupp adere à filosofia de “Toda IA para todos”, permitindo que os usuários descubram, comparem e utilizem facilmente os mais recentes modelos de IA. Ao contrário das respostas únicas tradicionais, Yupp retorna respostas de dois (ou até mais) modelos simultaneamente para cada solicitação, formando um “parlamento de IA”. Este design não só atende à demanda dos usuários por escolhas diversificadas, mas também identifica efetivamente potenciais “alucinações” que os modelos podem produzir, ajudando os usuários a tomar decisões mais informadas por meio da comparação. Como afirmou o CEO da Yupp, Pankaj Gupta, as saídas lado a lado são particularmente benéficas para os usuários preocupados com erros de geração, pois eles podem verificar os resultados.
A plataforma agora suporta mais de 500 modelos de IA, cobrindo os campos de geração de texto e imagem, incluindo modelos bem conhecidos como ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama e muitos modelos emergentes. Para otimizar ainda mais a experiência, a Yupp também lançou o recurso "QuickTake", que pode destilar respostas longas em um tweet conciso.
Além disso, a Yupp dá alta prioridade à privacidade do usuário: todos os registros de chat são privados por padrão, a menos que o usuário os torne públicos ativamente; mesmo quando compartilhados publicamente, nenhuma informação pessoal é divulgada. Os usuários podem controlar o conteúdo e o escopo do compartilhamento a qualquer momento.
Yupp usará o feedback dos usuários gratuitamente e medirá o uso do modelo através do sistema de “Yupp Points”. Novos usuários recebem 5000 pontos ao se registrarem e podem ganhar mais pontos avaliando as respostas do modelo, selecionando preferências e explicando suas razões. Quanto maior a qualidade do feedback, maiores as recompensas, garantindo que os usuários possam usar de forma sustentável modelos de alto nível como Claude Opus 4 ou OpenAI o3 gratuitamente. A plataforma promete que os pontos só aumentarão e que todos os modelos atuais podem ser experimentados gratuitamente.
Após cada pergunta, os usuários receberão duas respostas modelo e poderão ganhar um "cartão de raspadinha digital" por meio de feedback, recompensando pontos Yupp que variam de 0 a 250. A cada 1000 pontos, pode-se trocar por 1 dólar, com um limite máximo de retirada diária de 10 dólares e um limite mensal máximo de 50 dólares. Os pontos podem ser trocados por mais de 20 moedas, incluindo dólares e euros, com parceiros como Stripe, PayPal e Coinbase. Ao mesmo tempo, a plataforma integra Base Ethernet L2 e stablecoins da Solana para fornecer aos usuários globais recompensas instantâneas e sem taxas.
Como Pankaj Gupta disse, o feedback de alta qualidade gerado pelos usuários é muito mais valioso para o ajuste fino dos modelos e o aprendizado por reforço das empresas de IA do que as recompensas em si. Embora os ganhos mensais dos usuários possam ser equivalentes a apenas algumas xícaras de café, esses dados de anotação pagos são cruciais para a iteração da IA.
Para incentivar mais pessoas a participar, a Yupp também estabeleceu uma recompensa por indicação: o indicante recebe 5000 pontos, e a pessoa indicada recebe 1000 pontos; atualmente, novos usuários registrados podem receber 5000 pontos, e a pessoa indicada recebe adicionalmente 2500 pontos.
Para abordar os problemas existentes de transparência insuficiente nas classificações, falta de justiça e acesso desigual aos dados de avaliação, a Yupp lançou uma versão beta do ranking de IA e do sistema de classificação “Yupp VIBE (Vibe Intelligence Benchmark) Score”. Este sistema agrega dados de preferência gerados por usuários globais em interações naturais, visando fornecer resultados de avaliação robustos e confiáveis.
Os princípios de avaliação da Yupp incluem:
A plataforma não apenas coleta preferências binárias, mas também incentiva os usuários a apontar as vantagens e desvantagens das respostas (como "direto ao ponto", "velocidade rápida", "bom estilo", etc.), e realiza análise de cluster com base na idade, educação, ocupação e outras informações dos usuários para mostrar as diferenças de preferência entre diferentes grupos.
Em nível técnico, Yupp está explorando o uso de Blockchain, primitivos criptográficos e provas de conhecimento zero para garantir que o processo de avaliação seja justo, transparente e verificável. Ao mesmo tempo, a plataforma fez parceria com fornecedores profissionais de dados de IA para calibrar avaliadores por meio de verificação arquivística e detecção de qualidade em múltiplas camadas para eliminar dados maliciosos.
A lista de classificação recente foi atualizada, exibindo os scores VIBE de modelos como GPT‑4.5 Preview, Claude Opus 4 e Claude Sonnet 4, juntamente com suas taxas de vitória, taxas de deslike, velocidade, latência, janela de contexto e métricas de custo.
Yupp foi oficialmente lançado em 13 de junho de 2025, após seis meses de testes internos. Desde seu lançamento, o produto tem sido continuamente iterado:
A missão da Yupp é "capacitar a humanidade a moldar o futuro da IA." Pankaj Gupta acredita que o desenvolvimento da IA requer a participação e contribuição de todos. Através de respostas de IA de múltiplas perspectivas e feedback dos usuários, a Yupp não apenas ajuda os usuários a tomarem melhores decisões, mas também fornece uma força motriz contínua para a evolução da IA.
Vale a pena mencionar que um dos principais concorrentes da Yupp é a plataforma de avaliação de modelos de IA aberta LMArena (site:https://lmarena.ai/),O site é muito popular entre profissionais de IA, mas a plataforma está atualmente na fase de exploração comercial e não oferece recompensas materiais diretas ou mecanismos de incentivo de pontos para a participação do usuário, aproveitando a tecnologia Blockchain.
No geral, Yupp abriu um novo caminho para a avaliação de IA com seu modelo de crowdsourcing, mecanismo de incentivo e sistema de avaliação impulsionado pelas preferências reais dos usuários. Ele não apenas oferece aos usuários uma experiência interativa de IA gratuita e diversificada, mas também converte o feedback dos usuários em dados de treinamento de alto valor, promovendo a otimização contínua do modelo. Com uma equipe experiente e um respaldo de capital de primeira linha, espera-se que Yupp desempenhe um papel fundamental no futuro ecossistema de IA, realizando a visão de "IA para todos, moldada por todos."
No entanto, para o Yupp, que acaba de ser lançado, como garantir continuamente a qualidade dos dados, resistir a potenciais comportamentos de trapaça sob a participação de um grande número de usuários e encontrar um equilíbrio entre a comercialização e os incentivos dos usuários ainda será uma direção que precisa ser explorada e otimizada em seu desenvolvimento futuro.