• 微头条

    让本地生活更美好

打开APP

AI研究员警告:数据科学可能面临可重复性危机

2024-06-16 外星人S博士
AI研究员警告:数据科学可能面临可重复性危机

Source: Slashdot

一位长期从事人工智能研究的研究员发出警告称,数据科学“已到”一个必须重新审视结果是否能够重现的时刻。与机器学习不同,数据科学并非一个学术学科,拥有自己的算法和方法... 有着巨大的多样性,但数据科学家之间在技能、专业知识和认知方面也存在差异... 在实践中,根据他们的背景,数据科学家在计算机科学、软件工程、计算理论,甚至在机器学习背景下的统计学等方面可能存在很大的知识差距,尽管这些主题对于任何机器学习项目而言都是基础性的。但没事,因为你可以直接调用API,而且Python很容易学。

对吧...? 用机器学习和数据构建产品仍然很困难。工具基础设施仍然非常不成熟,数据和软件的非标准组合为工程团队带来了意想不到的挑战。在我看来,许多失败来自于这种仪式化机器学习的爆炸性混合:- 软件工程知识和实践的薄弱性与工具本身相互作用;- 在数学、统计和计算方法上的知识缺口,促进了针对API的黑匣子方式;- 数据科学家角色的能力范围定义不清晰,并由具有异常广泛背景的候选人池加强;- 倾向于追随炒作而非科学的趋势。

- 你能做什么?- 通过科学对你的数据科学家负责。- 在最低要求下,任何人工智能/机器学习项目应包括一个探索性数据分析,其结果直接支持特征工程和模型选择的设计选择。- 鼓励数据科学家跳出机器学习的小圈子- 训练数据科学家使用可解释的AI方法,以提供关于算法性能的背景信息,超越传统的性能指标如准确率、假阳性率或假阴性率。

- 数据科学家应被当作其他软件工程领域的专业人员,进行代码审查、代码文档编制和架构设计。这篇文章总结道:“在这些实践被确立为规范之前,我将继续对数据科学持怀疑态度。

数据科学在面临可重复性危机的时刻,如何确保其结果能够重现,值得深思。" } ```

特别声明:本文及配图均为用户上传或者转载,本文仅代表作者个人观点和立场,不代表平台观点。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本平台不作任何保证或承诺,请读者仅作参考, 并请自行核实相关内容。如发现稿件侵权,或作者不愿在本平台发布文章,请版权拥有者通知本平台处理。
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to info@microheadline.com
来源:https://slashdot.org/story/24/06/16/0131202/ai-researcher-warns-data-science-could-face-a-reproducibility-crisis?utm_source=rss1.0mainlinkanon&utm_medium=feed https://www.researchgate.net/publication/354645943_Improving_Reproducibility_in_Machine_Learning_Research_A_Report_from_the_NeurIPS_2019_Reproducibility_Program https://www.americanscientist.org/blog/macroscope/people-cause-replication-problems-not-machine-learning
更多阅读