Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

BioAIDevs
Construind următoarea generație de oameni de știință în AI.
Agenții AI încep să efectueze analize biologice reale: inspectează seturi de date, rulează fluxuri de lucru computaționale și produc rezultate valoroase de cercetare.
Pe măsură ce AI pentru știință se apropie de utilizarea practică în laboratoare, întrebarea modului de a evalua eficient agenții biologici devine din ce în ce mai importantă.
BixBench Verified 50 este o listă selectată de întrebări pentru evaluarea agenților biologici în mai multe domenii de bioinformatică.
Am testat BIOS AI Scientist pe BixBench Verified 50, alături de agenți AI cu scop general și specific domeniului.
BIOS-ul a condus cu o acuratețe de 90%, alături de K-Dense.
Urmat de:
> Biomni Labs - 88,7%
> Edison Scientific - 78,0%
> Claude - 65,3% &
> SDK OpenAI Agents - 61,3%
Vezi rezultatele complete:
O concluzie esențială: evaluarea agenților biologici nu se referă doar la funcționarea corectă a fluxului de analiză.
Într-o sarcină de referință, agentul a calculat corelațiile corecte, dar a interpretat greșit sensul biologic al unei coloane de set de date.
Rezultatul: analiză numeric corectă, dar concluzii inversate biologic.
Pe măsură ce agenții biologici trec de la repere controlate la medii științifice reale, trebuie să evaluăm fluxul de lucru, presupunerile și raționamentul, nu doar dacă răspunsul final este numeric corect.
Citiți mai multe în postarea noastră de pe blog:

140
Vă prezentăm API-ul BIOS: Transformați-vă agentul într-un cercetător științific
Astăzi lansăm API-ul BIOS – oferind dezvoltatorilor de agenți și dezvoltatorilor acces direct la același motor interactiv de cercetare științifică care alimentează aplicația web BIOS, prin REST și MCP.
Cercetare științifică profundă pentru dezvoltatorii de agenți
Începe o sesiune de cercetare cu un singur apel.
Alege-ți modalitatea:
• Direcție (o iterație odată)
• Semi-autonom (până la 5 cicluri)
• Complet autonom (până la 20 de cicluri, ~8 ore)
Fiecare sesiune returnează o stare vie de cercetare:
Obiective. Ipoteze. Descoperiri. Perspective. Seturi de date.
Plus rezultate complete ale ciclului de cercetare.
Inteligență științifică la cerere, accesibilă de la agenții, aplicațiile și fluxurile de lucru ale tale.
Infrastructură Agent-Native
📘 Specificația completă OpenAPI 3.1: generarea automată a clienților
🧪 Interactive API Playground
🧠 Suport pentru servere MCP
Conectează BIOS-ul direct la Cursor, Claude Desktop, Windsurf sau orice client compatibil MCP – și fă cercetări aprofundate din editorul tău.
De asemenea, planificăm:
• O abilitate ClawHub de înfășurare a endpoint-urilor BIOS pentru @openclaw ca agenții să le adopte
• Scule MCP mai profunde
• Integrări native între cadre de agenți
Pay-per-Query
Am integrat protocolul x402 ca o cale de plată – permițând agenților și aplicațiilor să plătească instantaneu pe interogare.
Știința de la mașină la mașină vine.
Ce vei construi?
Copiloți pentru descoperirea de medicamente?
Cercetași de longevitate?
Monitoarele automate de literatură?
Agenți de due diligence științific?
Spune-ne ce vrei să construiești cu API-ul BIOS.
Îți vom trimite credite gratuite în privat ca să începi să construiești.
Începe în linkul de mai jos ↓

74
Actualizare săptămânală de dezvoltare BIOS #2:
Mod de planificare, ramificare, citări bogate și altele
Ce e nou:
• Modul Plan: BIOS-ul pune întrebări clarificătoare înainte de a începe, apoi prezintă un plan de cercetare pe care îl poți aproba sau rafina până când se potrivește intenției tale.
• Ramificați-vă: Dublați căile de cercetare și ramificați-vă într-o direcție diferită, permițându-vă să modificați obiectivul fără a pierde munca inițială.
• Îmbunătățiri în generarea hârtiei: A fost reconfigurată fluxul de generare a hârtiei pentru a spori precizia și a permite citări mai bogate.
Urmează:
• Gândire: Actualizări de raționament în timp real cu vizibilitate în flux asupra sarcinilor în desfășurare.
• Modul Chat v2: Pentru a ajuta mai bine înainte sau după ce am început cercetări aprofundate.
• OpenAlex + Indexare Semantic Scholar: Permite cercetătorilor să interogheze 500M+ articole.

135
Limită superioară
Clasament
Favorite
