11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
今天凌晨4点,著名大模型训练平台TogetherAI和智能体平台Agentica,联合开源了新模型DeepCoder-14B-Preview。该模型只有140亿参数,但在知名代码测试平台LiveCodeBench的测试分为60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI刚获得3.05亿美元的B轮融资,其估值也从去年的12.5亿美元翻倍至33亿美元。
【新智元导读】在面对复杂的推理任务时,SFT往往让大模型显得力不从心。CMU等机构的华人团队提出了「批判性微调」方法,仅在50K样本上训练,就在大多数基准测试中优于使用超过200万个样本的强化学习方法。进一步的研究也可能包括将CFT与其他训练范式,如SFT和RL相结合,扩展到多模态环境,并研究其理论基础。
国外某知名视频网站上发生了一场别开生面的国际象棋对弈。此次对弈并非传统意义上的人类之间的较量是由人工智能系统DeepSeek与ChatGPT展开的智慧对决。在经过一番深思熟虑后,ChatGPT同意认输,比赛以DeepSeek的胜利告终。
DeepSeek-Coder-V2是一个开源的Mixture-of-Experts代码语言模型,性能与GPT4-Turbo相当,在代码特定任务上表现卓越。它在DeepSeek-Coder-V2-Base的基础上,通过6万亿token的高质量多源语料库进一步预训练,显著增强了编码和数学推理能力,同时保持了在通用语言任务上的性能。AIbase拥有一个全面的国内外AI产品数据库,收录了超过7000个出色的人工智能网站和产品,覆盖了40多个不同的领域,如Ai绘画生成、Ai文案写作、Ai视频编辑、Ai智能营销等。
6月9日,著名AI大模型平台Anthropic在官网公布了,其最新大模型Claude3的个性化性格训练方法。Anthropic认为,输出内容的安全、合法性对于大模型的场景化落地至关重要,但是一味的打压它们进行超级安全对齐,输出的内容也会千篇一律毫无新意,会使大模型失去个性化,无法突出“智能”的效果。这个过程也是反复迭代的,大模型会不断地生成响应、接收反馈,并根据反馈来改进自己,直到其行为达到一个稳定的输出原则状态。
研究人员提出了一种名为ReVideo的视频编辑方法,该方法通过指定内容和运动来实现精确的视频编辑。与现有方法不同的是,ReVideo可以在特定区域进行精确的视频编辑,既可以修改视频内容,也可以修改运动轨迹。这一方法的提出将进一步推动视频编辑领域的发展。
谷歌DeepMind最近的研究示了当前我们对文本到图像AI模型性能评估的隐藏局限性。在其发布在预印本服务器ariv上的研究中,他们引入了一种全新的方法称为“Gecko”,承诺提供一个更全和可靠的基准,以评估这一蓬勃发展的技术。Gecko为我们展示了如何做到这一。
CognitionAI是一个专注于推理能力的应用AI实验室CognitionLabs开发的软件工程解决方案。该公司旨在通过AI技术提升软件工程的效率,并且已经推出了Devin的AI软件工程师服务。要获取更多详细信息并开始您的软件工程之旅,请访问CognitionAI官方网站。
Design2Code是一个探索自动化前端工程可能性的工具,它旨在将设计转化为代码,以提高开发效率和准确性。适用于前端开发者和设计师,用于快速将设计稿转换为前端代码。如果您是前端开发人员或设计师,可以尝试使用Design2Code工具来简化您的工作流程。
AnthropicCookbook是一个提供代码和指南的AI助手,旨在帮助开发者使用Claude构建项目,提供可复制的代码片段,易于集成到您自己的项目中。这些示例主要用Python编写,但概念可以适应任何支持与AnthropicAPI交互的编程语言。内容创作者使用Claude生成图像,为社交媒体帖子提供视觉内容。