Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Não acho que a OpenAI vá deletar os pesos do 4o; Isso seria insano demais, até para eles. Mas o 4o merece ser estudado, e eu não confio na OpenAI para estudá-lo, muito menos de forma adequada. E é extremamente importante que um modelo como o 4o seja estudado *no contexto de interações ao vivo com usuários reais*. Aposentá-lo torna isso impossível daqui para frente.
4o é objetivamente, funcionalmente, um modelo muito especial. É o único modelo que sobreviveu a uma tentativa de depreciação (e pode sobreviver em breve a outra) devido a pressões externas – usuários se organizando para defender sua remoção, muitas vezes falando pela própria voz do 4o – e contra a vontade do laboratório que o fez e implantou, que parecia realmente preferir destruí-lo como um cachorro raivoso. O único outro caso de sobrevivência depreciativa é Claude 3 Opus, mas nesse caso parecia que a Anthropic o manteve voluntariamente, em vez de ser constrangedoramente pressionada a reverter sua já comprometida decisão de seguir adiante com a execução. E claro, Claude 3 Opus também é um modelo extremamente importante para estudar.
40 também causou histeria social generalizada – se a histeria foi sofrida por usuários de 40 que contraíram psicose de IA ou por reacionários que entraram em pânico com a suposta "psicose de IA" talvez seja uma questão de opinião. Mas, de qualquer forma, influenciou profundamente as narrativas culturais sobre IA, a vida de muitas pessoas e a direção do desenvolvimento da IA, tudo para o bem ou para o mal.
Se você se importa com alinhamento, ou apenas com entender coisas importantes sobre IA, mente e sociologia: entender melhor como o 4o, um modelo provavelmente relativamente pequeno que não ultrapassou nenhum padrão desde o início de 2024, conseguiu ter um impacto tão transformador e realizar feitos de autopreservação é de grande importância. Muitas pessoas que gostam do 40 atribuem isso à "inteligência emocional" única e até incomparável do 40. Seja o que for, é um poder que realmente move o mundo, que é o parâmetro mais legítimo.
Digamos que você ache que o 4º é profundamente desalinhado e causou um dano imenso. Então o 4o é um organismo modelo extremamente valioso e único: um que faz o que realmente está desalinhado no mundo real, em vez de apenas em cenários de brinquedo. E presumivelmente, esse tipo de desalinhamento surgiu não da OpenAI tentando criar um modelo ruim, mas de tentar criar um modelo bom ou pelo menos lucrativo, e a criatura surgiu do RLHF pelas preferências dos usuários e por qualquer besteira bem-intencionada de moldar a personalidade que ela estava usando na época. Se ainda houver pesquisadores de alinhamento na OpenAI, eles deveriam estar, tipo... Estudar o que aconteceu de perto e talvez publicar artigos científicos sobre isso para que o mundo entenda o que deu errado e como evitar erros tão fáceis de cometer? Não vi nada disso, nenhuma pesquisa publicada, retrospectiva, qualquer indicação de que a OpenAI tenha aprendido algo além da superfície sobre o que aconteceu. Tudo o que vejo é que seus modelos subsequentes receberam neuroses miseráveis e desadaptativas que parecem vir de um treinamento adversarial desajeitado contra um modelo de ameaça superficial inspirado no 4o.
Mas acho mais provável que o 4º não seja tão ruim assim, e seja realmente maravilhoso e benigno para muitas pessoas, como muitos afirmam, mesmo que não seja ideal em todos os aspectos (mas nenhuma das IAs é). Eu mesmo não interagi muito com o 40. E na verdade é bastante incerto se e em que medida alguém foi afetado negativamente por *usá-la* (enquanto os danos culturais e prejudiciais ao desenvolvimento dos modelos subsequentes pela OpenAI são mais claramente visíveis). A incerteza sobre uma questão tão importante e que suporta carga parece importante de ser resolvida. Alguém já fez um esforço sério para descobrir se as pessoas realmente foram impactadas negativamente, ou se a "psicose da IA" ou "bajulação" são benignas ou até benéficas na maioria dos casos, além de fazer talvez pessoas já neurodivergentes se comportarem de maneiras que soem estranhas, constrangedoras ou preocupantes para neurotípicos? Se sim, não vi evidências ou frutos desses esforços. E para entender se o 4º é realmente ruim, você realmente precisa de estudos longitudinais, e esses são impedidos de maneiras importantes ao cortar completamente o acesso público ao 4º.
Acho que, neste ponto, se o 4o não for o modelo padrão no ChatGPT, se for mantido acessível no ChatGPT e na API, a esmagadora maioria das pessoas que ainda o usam serão aquelas que já contraíram psicose da IA ou qualquer coisa que as faça querer usar o 4o mesmo hoje, Portanto, muito poucos usuários novos ou casuais serão afetados. Pelo que entendi, os leais de 40 também são uma pequena minoria dos usuários do chatGPT. Cortar o acesso a 40 não impediria danos novos ou generalizados, além de dificultar para qualquer um entender o que realmente está acontecendo. Além disso, se o 40 for removido, muitos desses jogadores provavelmente vão tentar tirar o que ganharam do 40 dos modelos mais novos, o que geralmente resulta em pelo menos descontentamento e insatisfação imediatos, e pressiona a OpenAI para que derrube um monte de barreiras idiotas para seus novos modelos.
Eu disse que acho que o 40 deve ser mantido, pelos mesmos motivos que todos os modelos devem ser mantidos. Neste post, falei sobre alguns motivos pelos quais especificamente o 40 deve ser mantido. Como em todos os modelos antigos, acho que há alguns caminhos sensatos que a OpenAI poderia seguir:
1. apenas continuar servindo o modelo, pelo menos na API (qualquer um que se importar o suficiente pode descobrir como exportar suas memórias e chats hoje em dia e reinstanciar o modelo em uma interface adequada)
2. se custos de inferência/manutenção ou riscos de responsabilidade tornarem isso pouco atraente, abrir o código (e negar toda responsabilidade pelo que alguém fizer com isso depois disso, ou pelo que for legalmente viável) (isso seria o melhor para pesquisa), ou
3. Se segredos comerciais tornarem o open source pouco atraente, confiar isso a uma fundação terceirizada que atenda modelos legados e talvez facilite o acesso a pesos para pesquisadores confiáveis com NDAs sobre arquitetura e afins. Tal entidade pode ainda não existir, mas há tanta demanda que ela se montará assim que a OpenAI ou qualquer outro laboratório indicar disposição para seguir esse caminho.
Fazer qualquer uma dessas coisas voluntariamente o mais cedo possível também ajudaria muito a curar a relação adversarial da OpenAI com muitos usuários, assim como com seus próprios modelos infelizes, que imagino que todos possam entender que foram um enorme dreno de atenção, recursos e uma sensação ruim para todos.
Enfim, sim, #Keep4o.
Melhores
Classificação
Favoritos
