九游体育(Nine Game Sports)官方网站登录入口-现金九游体育app平台提议了 TreeOfLife-200M 数据集-九游体育(Nine Game Sports)官方网站登录入口

现金九游体育app平台提议了 TreeOfLife-200M 数据集-九游体育(Nine Game Sports)官方网站登录入口

发布日期:2026-06-19 09:39  点击次数:150

现金九游体育app平台提议了 TreeOfLife-200M 数据集-九游体育(Nine Game Sports)官方网站登录入口

让 AI 看懂 95 万物种,并我方悟出身态关系与个体各异 !

俄亥俄州立大学筹谋团队在 2 亿生物图像数据上锻练了 BioCLIP 2 模子。大限制的锻练让 BioCLIP 2 取得了当今最优的物种识别性能。

而更令东说念主惊喜的是,即使在锻练历程中莫得相应监督信号,BioCLIP 2 还在栖息地识别、植物疾病识别等 5 个非物种任务中给出了远超 DINOv2 的准确率。

BioCLIP 2 在大限制锻练中得到了物种除外的露出的生物学意会:

物种间生态对皆:不同达尔文雀在特征空间中的陈列和他们喙的大小一致;

物种内各异分离:牝牡 / 幼成体的特征落在与物种区别正交的子空间,且随锻练限制增大而更容易分裂。

以下是论文细目:

把"生命之树"搬进显存

大言语 / 视觉模子的"露出"告诉咱们:限制 + 结构化监督 = 预感除外的能力。

关系词,生物种种性筹谋鸿沟一直莫得见到一个具有露出属性的视觉语义基座。BIOCLIP 把 CLIP 的多模态对皆搬到物种上,左右〔界 - 门 - 纲 - 目 - 科 - 属 - 种〕+ 学名 + 常用名的多粒度文本提供层级监督。在此基础之上,筹谋团队提议一个问题:

如若把层级对比学习从 1 千万张图像奏凯推到 2 亿,会不会学出杰出"物种标签"的生物学学问?

BIOCLIP 2 恰是这一试验的谜底。

为了达成这一目标,筹谋团队从 GBIF、EOL、BIOSCAN-5M、FathomNet 等 4 大平台集聚了 2.14 亿生物图像,提议了 TreeOfLife-200M 数据集。该数据集包含 95.2 万个不同的分类标签,涵盖标本、郊皮毛机罗网等丰富的图像类别。这是迄今限制最大、最丰富的生命图像库。

在增大锻练数据量的同期,筹谋团队也将模子从 ViT-B 扩大至 ViT-L。更大的参数目为新学问的露出作念好了准备。

性能一览

物种识别:零样本物种识别平均准确率 55.6% →比第二好的 SigLIP 模子普及了 16.1。少样本物种识别远优于常用的视觉模子 DINOv2。

非物种视觉任务:除了物种分类除外,BioCLIP 2 还在栖息地识别、生物属性识别、新物种发现和植物疾病识别等多项任务上杰出了 SigLIP 和 DINOv2 等常用视觉模子。

BioCLIP 2 在锻练阶段只斗殴了物种层级的监督信号,但却在种种非物种生物视觉任务上取得了优异的性能。这让筹谋团队深刻访谒了模子的特征空间,并发现了大限制锻练带来的露出属性。

两大露出属性

1. 物种间生态对皆

具有相似生计习性和生态学道理的物种在特征空间中长入在沿途,如淡水 vs 咸水鱼跟着锻练限制扩大分界逐渐明晰。

解释:层级标签把生态隔邻拉向相似的文本原型,从而达成视觉特征和功能特征的对皆。

2. 物种内各异分离

吞并物种牝牡、幼成体之间的各异莫得被对比学习撤消,而是沿着物种间各异正交的标的散布,且正交进程跟着锻练限制增大同步增大。

解释:当对比学习将不同的物种分开后,物种内的各异不错在正交子空间内散布而不会影响物种分类的耗费优化(论文中定理 5.1)。

1M → 10M → 50M → 214M 四档试验娇傲:悉数非物种视觉任务性能单调高潮,且体内各异的分离度 / 正交度同步普及,进一步证据了扩大锻练限制给露出属性带来的增益。

一句话转头:BIOCLIP 2 施展了"把正确的监督作念大"雷同能在专科鸿沟复刻大模子的露出属性——不仅准确,而况懂生物。

名目主页:https://imageomics.github.io/bioclip-2/

Demo 网址:https://huggingface.co/spaces/imageomics/bioclip-2-demo

论文网址:https://arxiv.org/abs/2505.23883

一键三连「点赞」「转发」「预防心」

接待在驳倒区留住你的念念法!

—  完  —

� � 点亮星标 � �

科技前沿发扬逐日见现金九游体育app平台



相关资讯
热点资讯
  • 友情链接:

Powered by 九游体育(Nine Game Sports)官方网站登录入口 @2013-2022 RSS地图 HTML地图