Gemini 2.5 Pro per ragionamento avanzato su task complessi

Gemini 2.5 Pro è il modello che apro quando devo ragionare su un problema architetturale lungo, con un contesto fatto di molti file e diagrammi a parole. La finestra di contesto enorme permette di buttargli dentro un’intera codebase media insieme alla documentazione e farci sopra un ragionamento integrato. Lo uso quando l’output non è “scrivimi codice” ma “aiutami a capire”.

Il modello è proprietario, sviluppato da Google DeepMind, pesi non disponibili. Per i ragionamenti misti su molti file resta una scelta forte sul piano della qualità tecnica, ma la sezione privacy che segue va letta con attenzione: il free tier ha condizioni molto diverse dagli altri provider di questo gruppo.

Configurazione di opencode

La chiave la genero su aistudio.google.com/apikey, gratis, salvata in ~/.config/claude-credentials/credentials.env come GEMINI_API_KEY. Nel file ~/.config/opencode/opencode.json registro il provider come OpenAI-compatible puntando all’endpoint compatibile di Google:


{
  "provider": {
    "gemini": {
      "npm": "@ai-sdk/openai-compatible",
      "options": {
        "apiKey": "{env:GEMINI_API_KEY}",
        "baseURL": "https://generativelanguage.googleapis.com/v1beta/openai"
      },
      "models": {
        "gemini-2.5-pro": { "name": "Gemini 2.5 Pro" }
      }
    }
  }
}

Per aprirlo nella TUI con il working directory montato:


opencode . --model gemini/gemini-2.5-pro

La cartella che passo come argomento è di solito ~/Documenti/progetti//, con il codice e i README che voglio fargli leggere insieme. Esiste anche l’SDK ufficiale google-genai con CLI propria, comoda per pipeline non interattive, ma per il testo conversazionale lascio opencode come default.

Un esempio di sessione reale

Mercoledì alle 14:30 stavo valutando come riorganizzare l’integrazione tra due miei tool: uno che raccoglie metriche di servizi auto-hosted e uno che le mostra su una dashboard. C’erano dipendenze incrociate fastidiose e una storia di duplicazione di logica tra i due. Ho aperto opencode dentro progetti/integrazione/, dove avevo già messo le due repo come sottocartelle (collector/ e dashboard/) e un file vincoli.md con i requisiti operativi: uptime, costo, latenza accettabile. Il prompt:

leggi collector/, dashboard/ e vincoli.md. Identifica le dipendenze tra i due moduli, distingui quelle essenziali da quelle accidentali. Proponi tre strategie di disaccoppiamento con trade-off espliciti, e per ognuna stima il rischio implementativo da uno a cinque.

La risposta è arrivata in circa otto secondi. Tre strategie distinte: bus di eventi NATS, contratto API REST con OpenAPI versionato, file system condiviso con manifest JSON. Per ognuna ha elencato rischio, costo, tempo di migrazione stimato. Ho scelto l’API REST dopo aver verificato che le sue stime di tempo erano realistiche per il mio contesto.

Cosa fa bene

Sintesi tra molti file dentro lo stesso contesto. Confronto strutturato di alternative architetturali. Lettura simultanea di codice e documentazione con riferimenti incrociati corretti. Stesura di RFC interne ben formattate. Discussione di trade-off con argomentazioni motivate, non solo riassuntive.

Cosa fa meno bene

Latenza più alta dei modelli su LPU: parecchi secondi su prompt lunghi. Sulle code-gen pure non è più veloce né più preciso di Qwen3 32B su Groq. Su task brevi e veloci è sovradimensionato. La sezione privacy lo rende inutilizzabile per molti contenuti che invece manderei tranquillamente a Groq o Cerebras.

Privacy e termini del provider

Qui c’è una asimmetria importante rispetto agli altri provider del gruppo. Sul free tier di Google AI Studio / Gemini API, prompt, contesto, file e output vengono usati per migliorare i modelli. Esistono revisori umani su snippet anonimizzati. Non c’è opt-out nativo sul free: l’unico modo per disattivare il training è passare al Paid Tier (prepay minimo da circa 10 dollari). La retention per abuse monitoring è 55 giorni su entrambi i tier.

La residency è “any country”, senza commitment geografico. Le garanzie di residency arrivano solo su Vertex AI in piano enterprise, non su AI Studio free. Punto cruciale: il free tier è contrattualmente vietato per applicazioni che servono utenti EEA, UK o Svizzera. Va bene per uso individuale personale fuori da questi requisiti, ma non per qualunque cosa serva clientela europea.

Il modello Gemini 2.5 Pro è proprietario, closed source, pesi non disponibili. Non posso ispezionarlo né riprodurlo fuori dal provider.

Cosa non gli mando

Per il free tier la regola è stretta: niente di niente che non vorrei vedere usato per migliorare il modello. Niente codice di clienti, niente note interne, niente log con dato personale, niente bozze di articoli che non ho ancora pubblicato. Lo uso per ragionamenti su codice mio già pubblico su GitHub, su documentazione open, su esercizi architetturali sintetici. Per tutto il resto fallback su qwen2.5-coder:14b su Ollama in locale, dove il dato resta sulla mia macchina senza nessun trasferimento.

In pratica

Nel mio toolkit Gemini 2.5 Pro è il “ragionatore architetto” per contenuti che posso considerare già pubblici. Per ragionamento su documentazione tecnica densa con privacy migliore vado su Qwen3 235B su Cerebras: pesi open Apache 2.0, no training dichiarato. Per scrittura di prosa tecnica lunga e veloce uso Llama 3.3 70B su Groq. Per coding chirurgico Qwen3 32B su Groq. Gemini 2.5 Pro resta nel mix per i casi in cui mi serve davvero la sua finestra enorme su materiale che non ha problemi a essere visto.

Immagine generata con Cloudflare Workers AI / FLUX.

Gemini 2.5 Pro per ragionamento avanzato su task complessi

Configurazione di opencode

Un esempio di sessione reale

Cosa fa bene

Cosa fa meno bene

Privacy e termini del provider

Cosa non gli mando

In pratica

More posts

Cloudflare Workers AI: FLUX.1 schnell per generazione immagini ultra-rapida

OpenRouter come gateway: qwen3-coder:free per code-gen di backup

Gemini 2.5 Pro per ragionamento avanzato su task complessi

Gemini 2.5 Flash-Lite per OCR e analisi screenshot