返回 hu86科技
   

悉尼科大突破:扭矩聚类引领无参数自主AI新时代

2025-02-14

当一个数据集被交给人工智能学习或分析时,类数据被分成组或模式进行有效处理。聚类方法有很多,其中K-Means、DBSCAN和分层聚类是最常用的。每种方法都有其优点和缺点:数据的复杂性、处理成本等。

更重要的是,每种方法都需要某种人为干预,无论是设置参数,如预定义集群的数量、epsilon距离、每个集群的最小点或层次距离度量 —— 等等。如果这些人为设置的参数中有任何一个不正确,输出将变化很大,甚至完全不正确。

你是否听说过“人工智能幻觉”,即人工智能大型语言模型(LLM)输出荒谬或错误的响应?虽然聚类问题并不是这些幻觉的完全原因,但如果相似的单词或模式被错误地组合在一起,它们确实会造成幻觉。想想看:聚会角落里的一个人,当他无意中听到“铲子传球”这个词时,他加入了体育小组。但实际上,他最好和园艺爱好者谈谈,因为他对铲子比触地得分了解得多。幻觉远不止于此,但这是另一篇或十篇文章。

监督学习 —— 人类标记、定义和设置参数 —— 耗时、昂贵,并且随着数据集复杂性的增长变得非常困难。扭矩聚类(Torque Clustering)的概念将把人类预定义的值和人类监督完全排除在等式之外,允许AI做出自己的预测,并更有效地查看数据集中的关系。

到目前为止,研究人员已经在1000个不同的数据集上测试了扭矩聚类算法,AMI得分为97.7%。AMI是一种“调整后的相互信息”分数,用于衡量数据簇的组织情况。运动配运动,园艺配园艺等等,即使运动和园艺都有类似的词,如“铲”、“草皮”和“种子” …… 你懂的。

相比之下,其他被认为是最先进的聚类方法的AMI得分在80%的范围内。

该研究的第一作者杨洁(音译)博士说:“扭矩聚类的独特之处在于它基于扭矩的物理概念,使其能够自主识别聚类,并无缝地适应不同的数据类型,具有不同的形状、密度和噪声程度。”“它的灵感来自星系合并时引力相互作用中的扭矩平衡。它基于宇宙的两个自然属性:质量和距离。”

要处理的事情很多,但在人工通用智能(AGI)的发展中确实显示出了希望。给一个空白的AI提供大量数据来“弄清楚”似乎既有趣又有风险。它真的是无参数和完全自主的吗?或者它是用隐藏的启发式来引导它的学习路径?

整个扭矩聚类(Torque Clustering)项目 —— 在过去几天里一直是头条新闻 —— 是开源的,任何人都可以在GitHub上找到它,所以,我们可能很快就会找到所有问题的答案。但自2024年5月以来,它一直可用,我还没有看到它作为人工智能训练的广泛采用的方法 …… 也许我们已经有答案了。

最新文章

荣耀300震撼发布:1999元旗舰级体验,重新定义手机市场!

推荐

 

阅读10126

DVD光盘:从时代经典到环保挑战,回收行动刻不容缓

推荐

 

阅读13924

沙漠中的未来之城:沙特“Line”巨型城市项目揭开神秘面纱

推荐

 

阅读14240

真我13Pro+:千元机皇,潜望长焦+顶级性能,颠覆性价比极限!

推荐

 

阅读17191

真我GT6:高性能与亲民价的完美碰撞,游戏续航拍照全面升级!

推荐

 

阅读17243