terça-feira, 27 de janeiro de 2026

O elusivo futuro da IA

Como o leitor, também sou um usuário comedido da IA e o uso reforça a constatação de que ela tem evoluido rapidamente. As chamadas “alucinações” tem gerado cada vez menos crítica, até porque têm rareado à medida que versões novam surgem.

Um corte importante no universo das IA é separar sistemas de código aberto, os que podemos importar sem custos pela rede e usá-los a nosso talante, dos fechados, que nos pedem assinatura, eventual pagamento, e se mantêm fora de nosso controle direto. Dentre os de código aberto, há os que prescindem de uma conexão à rede, por trazerem junto toda sua base de informação. Esses pedem um computador local mais poderoso e, especialmente, com muito mais memória. Mesmo assim, não deixa de ser impressionante e assuntador imaginar que o “mundo conhecido” cabe numas dezenas de GB, em termos de IA. O mundo numa casca de noz... de silício. Um teste que mereceria maior atenção é compararmos a resposta que nos fornece uma IA aberta, local, sem acesso à Internet, vis-a-vis uma IA fechada, com acesso irrestrito à rede. Não raramente, a IA local tende a “alucinar” menos e, até, reconhecer que pode não ter resposta para dada pergunta. A com acesso à rede toda, porém, é mais sujeita a inserções aleatórias, e acaba por ser vítima de conteúdos falsos dos que há fartamente na rede.

Uma reportagem da BBC de há uns dias, mostra que as IA abertas, muitas delas de origem chinesa, são hoje a primeira escolha para aplicativos de uso geral. Uma consulta ao Hugging Face, por exemplo, mostrará que 4 das 5 IA mais baixadas ou usadas são chinesas. A reportagem cita o Pinterest como um aplicativo de uso geral que usa IA aberta chinesa, mas isso não se resume apenas a aplicativos: também é a opção de escolha de empresas iniciantes, universidades, governos, dada a óbvia e favorável relação custo/benefício.

Qual o modelo visado nos casos aberto e fechado? Claro que o modelo fechado buscará viabilizar-se com as receitas do serviço, mesmo que hoje ainda seja muito difícil prever quando esse equilíbrio será atingido, especialmente pelos custos em máquinas e instalações. Já modelo aberto não busca o retorno financeiro direto. O modelo é mais insidioso, e envolverá diferentes níveis de ação. No mais elementar a coisa mostra-se gratuita, mas há toda uma cadeia armada que não visa não apenas ao fabricante, mas aos diferentes níveis do ecossistema. Não se trata de uma competição convencional: os modelos abertos chineses não competem como produtos, mas como infraestrutura. Não buscam apenas o mercado no curto prazo, mas tornar-se padrão sobre o qual outros constroem. Quem gera um padrão de sucesso, não precisa cobrar por ele.

Voltando à defesa da Internet única e aberta, se num primeiro momento o uso de IA sem acesso parece diminuir a importância de uma internet geral, lembremos que se a idéia é evoluir o que a IA já sabe, é a rede aberta que proverá um futuro dinâmico, e não apenas uma biblioteca cristalizada. Controlar o ecossistema e garantir que ele seja ubíquo é mais importante que cobrar pelo modelo. Quem vende produtos, disputa mercados, mas quem define e distribui infraestrutura molda o futuro.

===
https://www.estadao.com.br/economia/demi-getschko/ia-aberta-pode-ser-a-continuidade-da-internet-no-futuro/




===
O artigo citado da BBC:
https://www.bbc.com/news/articles/c86v52gv726o

https://huggingface.co/

===
Modelos locais bastante difundidos:
Llama 3 / 3.2 (Meta)
Qwen 2.5 / 3 (Alibaba)
Mistral 7B Instruct
Gemma 2 (Google)
DeepSeek-R1-Distill

Tamanho de memória local RAM/VRAM necessária pode ir de 8GB a 128GB dependendo do tamanho do modelo...
- Modelos pequenos (entre 3B e 7B parâmetros): de 8GB a 16GB de RAM/VRAM.
exemplos: Llama 3 8B, Mistral 7B, Phi-3 Mini, etc.
- Modelos médios (entre 13B e 30B parâmetros): de 16GB a 32GB de RAM/VRAM.
exemplos: Llama 3 13B, Qwen2.5-Coder 14B, Gemma 3 12B, etc.
- Modelos grandes (entre 30B e 70B parâmetros): de 32B a 64B de RAM/VRAM
exemplos: Llama 3 70B, Qwen3-30B, Mistral Large 2, etc.

===


terça-feira, 13 de janeiro de 2026

A busca pelo conforto

Os antigos sentem falta e talvez um pouco de nostalgia dos tempos iniciais da internet. Muitos dos recursos que temos não existiam; a rede era amplamente distribuída, e cabia a cada usuário definir sua participação, com autonomia e responsabilidade. Vieram então os buscadores, que nos aliviaram da extensiva pesquisa e exploração na rede; as plataformas de agregação, que substituiram as antigas BBS (“Bulletin Board Systems”) como “grupos de interesse”; as redes sociais que potencializaram as encrencas e brigas que já ocorriam nas listas de discussão. Logicamente empresas lançaram esses serviços e capturaram receitas inimagináveis numa rede que era essencialmente gratuita.

Há o impulso do “negócio”, mas também é claro que os próprios usuários buscaram esses serviços, por conforto, conveniência e redução de esforço. Ninguém nega as vantagens que os buscadores trazem, mas, à medida que esse espectro de plataformas se expande, há uma acomodação e um abandono de julgamento sobre a relação custo-benefício entre o que recebemos e o que entregamos como contrapartida automática e nem sempre criteriosa.

Não é coisa excepcional, mas algo “humano, demasiado humano” na expressão de Nietzsche, descrevendo nossa tendência em buscar conforto, atalhos, tutela e alívio do esforço, mesmo que isso implique em menos autonomia.

Na raíz histórica da intenet, vemos que ela não surgiu como exceção, mas como evolução de longa história de infraestruturas neutras de comunicação. Não é por acaso que, por exemplo, o protocolo para correio eletrônico chamou-se SMTP (“Simple Mail Transfer Protocol”): sua função básica é entregar mensagens eletrônicas, emulando o correio tradicional: interoperável, com neutralidade e sigilo. Os protocolos da internet segues essa linham: foram concebidos para transportar pacotes sem conhecer seu significado. A rede não distingue o que nela trafega: essa separação entre infraestrutura e conteúdo, consagrada no princípio end-to-end é o que torna a rede escalável, resiliente e inovadora.

Essa “busca de conforto” vai além dos usuários e estende-se a governos. Se algo ameaça, é mais facil amputar a rede e serviços do que buscar os verdadeiros agentes do problema. Em vez de responsabilizar quem cria, publica ou difunde intencionalmente conteúdo nocivo, tenta-se impedir sua circulação pelo controle da infraestrutura e vastos bloqueios. O paradoxal efeito é que o verdadeiro gerador do conteúdo torna-se invisível, enquanto a infraestrutura — neutra por definição — carregará esse ônus. Confundir meio e mensagem é um erro antigo. Não se combate difamação abrindo cartas, nem heresia desligando impressoras. Tentar controlar a circulação ao invés de enfrentar o uso gera perda de conectividade e valor.

Defender a internet única não é negar a autoridade dos Estados, nem minimizar problemas reais. É reconhecer que infraestruturas funcionam melhor quando permanecem neutras e transfronteiriças, e que conflitos legítimos devem ser tratados pontualmente, responsabilizando-se o agente, seja ele quem for. Já delegamos o esforço, estamos delegando o julgamento e, afinal, a reponsabilidade. Nada mais “humano, demasiado humano”...
===
https://www.estadao.com.br/economia/demi-getschko/defender-a-internet-unica-nao-e-negar-a-autoridade-dos-estados-nem-ignorar-problemas-reais/

https://olhardigital.com.br/2025/09/05/internet-e-redes-sociais/redes-sociais-sao-bloqueadas-no-nepal-precedente-perigoso/

https://meiobit.com/467159/vpns-reino-unido-proibir-acesso-menores-lei-seguranca-online/

https://www.cnnbrasil.com.br/blogs/americo-martins/internacional/australia-e-o-primeiro-pais-a-banir-redes-sociais-para-menores-de-16-anos/

https://www.cnnbrasil.com.br/internacional/ira-esta-sem-internet-ha-48-horas-enquanto-protestos-crescem-diz-monitor/

===
https://pt.wikipedia.org/wiki/Humano,_Demasiado_Humano

https://www.companhiadasletras.com.br/trechos/80257.pdf