马斯克认同 AI 训练数据已耗尽的观点，并称合成数据将成未来方向

ChainCatcher 消息，据 TechCrunch 报道，埃隆·马斯克在与 Stagwell 董事长 Mark Penn 的直播对话中表示，目前 AI 模型的训练已基本耗尽真实世界的数据，“我们已经用尽了人类知识的累积总和，这在去年就发生了。”马斯克与前 Open AI 首席科学家 Ilya Sutskever 的观点一致，后者在 NeurIPS 机器学习大会上提出 AI 行业已达到“数据峰值”，未来可能需要改变模型开发方式。马斯克认为，合成数据将是补充真实数据的途径， AI 将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、 Meta 、Open AI 和 Anthropic 等科技巨头采用，如微软 Phi -4 模型和谷歌 Gemma 模型都结合了真实数据和合成数据进行训练。 Gartner 预测，2024年 AI 和分析项目中约 60% 的数据将为合成生成。合成数据的优势包括成本节约，例如 AI 初创公司 Writer 仅花费约 70 万美元开发其几乎完全基于合成数据的 Palmyra X 004 模型，相比之下，类似规模的 Open AI 模型开发成本约为 460 万美元。然而，合成数据也存在风险，包括模型创造力下降、输出偏差加剧，以及潜在的模型崩溃，尤其当训练数据本身存在偏差时，生成结果也可能受到影响。

OK交易所是全球排名前三的数字货币交易平台，非常符合国人操作，买卖比特币就上OK交易平台

微软将在印度投资 30 亿美元用于人工智能、云扩展和培训

消息人士：特朗普就职首日预计至少会出台一项加密行政命令

马斯克认同 AI 训练数据已耗尽的观点，并称合成数据将成未来方向

相关阅读

目录[+]