据TechCrunch周二报道,承包商正在比较谷歌Gemini AI的回答与其竞争对手Anthropic的Claude模型的输出。 虽然TechCrunch联系谷歌询问是否获得使用Claude的许可,但谷歌未作回应。 在科技公司竞相构建更优秀AI模型的背景下,这些模型的表现通常通过行业基准进行评估,而不是让承包商逐一评估竞争对手的AI回答。 负责Gemini的承包商需要根据多个标准,如真实性和详尽性,对模型输出的准确性进行评分,每个提示的评估时间限制为30分钟,以确定Gemini和Claude哪一个的答案更好。