首页 > 业界 > 关键词  > 千帆大模型最新资讯  > 正文

AI视野:百度千帆大模型适配Falcon-180B;OpenAI将举行首届开发者大会;微软测试新版画图工具

2023-09-08 14:47 · 稿源:站长之家

>>>>>>大模型动态<<<<<<

蚂蚁发布金融大模型 针对金融产业深度定制

蚂蚁集团在外滩大会上发布了自主研发的金融大模型,该模型在语言理解、生成、专业知识等多个维度取得显著进步,已经在蚂蚁旗下的财富、保险等平台内测,同时发布了基于该模型的智能金融助理“支小宝2.0”和业务助手“支小助”两款产品。

微信截图_20230908161439.png

要点:

1、蚂蚁集团发布自主研发的金融大模型,该模型达到万级卡规模,在多个金融专属任务上表现优异。

2、金融大模型已经在蚂蚁集团的财富、保险等平台上全面内测。

3、发布了基于该模型的智能金融助理“支小宝2.0”和业务助手“支小助”两款产品。

百度智能云千帆大模型平台适配开源大模型Falcon-180B

百度智能云千帆大模型平台宣布率先适配开源大模型Falcon-180B,提供全流程工具链和开发环境,帮助企业和开发者体验应用这一最新大模型能力。

微信截图_20230908135033.png

要点:

1、百度智能云千帆大模型平台适配开源大模型Falcon-180B

2、提供全流程工具链和开发环境

3、方便企业和开发者体验和应用Falcon-180B

喜马拉雅推出白酒SIVA营销模型

喜马拉雅推出白酒SIVA营销模型,通过内容生态和人群运营策略满足不同白酒品牌的营销需求,覆盖消费决策链路的各个阶段。

微信截图_20230908141006.png

要点:

1. 喜马拉雅白酒SIVA营销模型具有品牌故事定制、声音广告、播客内容合作等10余种营销工具。

2. 模型通过消费者画像和行为数据洞察用户需求,帮助白酒品牌进行差异化定位。

3. SIVA模型策略覆盖消费决策链路的多个阶段,提升品牌全链路经营效能。

百川智能大模型API将于9月20日上线

百川智能宣布其大模型API将于9月20日正式上线,用户可以直接申请调用。此前,百川智能在9月6日举行的大模型发布会上正式开源了 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 以及其4bit 量化版本,并且免费可商用。

微信截图_20230908115245.png

Baichuan2下载地址:https://github.com/baichuan-inc/Baichuan2

要点:

1. 百川智能大模型API将于9月20日上线。

2. 用户可以直接申请调用百川智能大模型API。

3. 百川智能此前已经开源了多个通用大语言模型,包括Baichuan2-7B、Baichuan2-13B等。

>>>>>>AI应用<<<<<<

微软测试新版画图工具,增加一键去除背景AI功能

微软正在测试新版画图工具,该工具允许用户一键去除图像背景。新功能已推出给Windows Insiders,Canary和Dev Channels可体验。这一改进将使画图工具更加实用,减少了用户使用第三方应用的需要。

image.png

要点:

1. 微软正在测试新版画图工具,该工具允许用户一键去除图像背景。

2. 新功能已推出给Windows Insiders,Canary和Dev Channels可体验。

3. 这一改进将使画图工具更加实用,减少了用户使用第三方应用的需要。

eBay推出AI生成工具,卖家上传图片即可生成产品列表

eBay推出AI生成工具,卖家上传产品图片后,该工具可自动生成产品标题、描述和分类信息,旨在简化卖家的销售流程,尤其对新手卖家更为友好,但也存在生成文本质量参差不齐的问题。

image.png

要点:

1. eBay的新AI工具可以通过卖家上传的产品图片自动生成标题、描述等信息。

2. 该工具简化了销售流程,对新手卖家更为友好。

3. 生成的文字质量并不统一,部分卖家对此提出不满。

AI文档阅读神器司马阅 通过聊天方式帮你精准获取关键信息

司马阅是一款基于 AI 技术的智能文档助手,可以上传 PDF、Word 等多种格式文档,通过语音或文字与文档进行交互,快速定位关键信息。

image.png

体验地址:https://smartread.cc/

要点:

1.通过深度学习技术,司马阅可以提取关键句子、重点内容,自动生成文档摘要,大幅提升工作学习效率。

2.用户可以用语音或文字提问,快速获取要点。

3.该工具广泛应用于合同审阅、论文阅读、报告撰写等场景,助力专业人士事半功倍。

>>>>>>>聚焦开发者<<<<<<

重磅!新语言Mojo开放下载,运行速度超Python6.8万倍

新语言Mojo开放编译器和IDE下载,语法类Python但运行速度可达Python的6.8万倍,这在开发社区引起了轰动。

image.png

要点:

1. Mojo通过类型注释、向量化、多核并行等手段大幅提升运行速度。

2. Mojo兼容Python生态,可与Numpy、Pandas等库无缝交互,受到AI开发者关注。

3. Mojo的创始人是LLVM和Swift语言的创造者,他认为Mojo不是来取代Python,而是给Python开发者带来超强性能。

清华提出4比特优化器 显著减少LLaMA微调的显存需求

针对优化器状态的量化方法,将优化器状态的数值精度降低至4比特,在多个微调任务中实现接近全精度优化器的性能,可将LLaMA微调的显存需求减少超过50%。

image.png

要点:

1、针对优化器状态的量化方法,将优化器状态的数值精度降低至4比特

2、提出了针对一阶矩和二阶矩的量化策略,处理了零点问题等难点

3、在多个微调任务中达到全精度优化器的性能,同时可将LLaMA微调的显存需求减少超过50%

YaRN:可高效扩展现有大模型的上下文窗口长度

YaRN是一种计算高效的方法,可以扩展基于transformer的语言模型的上下文窗口,与以前的方法相比,它需要10倍更少的token和2.5倍更少的训练步骤。

image.png

项目地址:https://github.com/jquesnelle/yarn

要点:

1、YaRN利用了旋转位置嵌入(RoPE)来增强模型处理顺序数据和获取位置信息的能力,同时通过压缩变压器来扩展上下文窗口。

2、YaRN只需要400个训练步骤就能成功实现语言模型的上下文窗口扩展,相比之前的方法降低了10倍的训练样本量和2.5倍的训练步骤。

3、YaRN改进了所有现有的RoPE插值方法,以无缺点和最小的实施努力替换了PI,微调后的模型在多个基准上保持了原有的能力。

Doppelgangers:通过学习算法区分相似结构的图像

Doppelgangers是一个通过学习算法区分视觉高度相似但物理上不同3D表面图像的方法。

image.png

论文地址:https://doppelgangers-3d.github.io/

要点:

1. 构建包含大量正负样本的图像区分数据集Doppelgangers。

2. 设计网络架构,以局部特征和匹配分布作为输入判断是否为同一3D表面。

3. 可集成到3D重建流程中,过滤错误匹配提高重建质量。

>>>>>>>AI新鲜事<<<<<<

OpenAI将于11月6日举办首届开发者大会,将展示最新技术和想法

OpenAI将于11月6日在旧金山举办首届开发者大会OpenAIDevDay。会上将预览新工具并交流想法,具体内容待公布。此举旨在向开发者展示最新成果,也是OpenAI的一个营销机会。

ChatGPT OpenAI  人工智能 (1)

要点:

OpenAI将于11月6日举办首届开发者大会,将预览新工具和交流想法。

开发者大会上,OpenAI团队将主持主题演讲和小组讨论。

此举对OpenAI来说是一个营销机会,以推动其商业成功。

微软宣布为商业客户提供新的 Copilot 版权承诺:将承担潜在法律风险

微软公司宣布,如果商业客户因使用其人工智能产品Copilot生成的内容遭侵权诉讼,微软将承担法律责任。微软表示,只要客户使用了Copilot中的内置防护措施,公司将承担第三方的任何潜在诉讼风险。

Windows Copilot,微软,人工智能,AI

要点:

1. 微软承诺承担Copilot商业用户的潜在法律风险。

2. 条件是商业用户要使用Copilot内置的防护措施。

3. 微软此举是应对版权持有人对AI生成内容的担忧。

用人伪装AI?热门AI初创公司Kaedim虚假宣传其3D模型生成技术

据404Media报道,AI初创公司Kaedim虚假宣传其3D图像生成技术,声称可自动从2D图生成3D模型,但实际上公司雇佣艺术家直接绘制高质量3D图像,没有使用AI。

image.png

要点:

1. Kaedim声称其技术可以自动从2D图像生成高质量3D模型,其创始人因此入选了福布斯30位30岁以下精英的榜单。

2. 但实际上,Kaedim的AI生成的3D图像质量很差,有时只是不成形的一堆线条。

3. 根据两名知情人透露,Kaedim有时直接让艺术家完全从零开始绘制高质量3D图像,而没有使用任何AI技术。

ChatGPT Plus强劲对手来了!Anthropic推付费订阅计划 Claude Pro

谷歌支持的由前 OpenAI 员工共同创立的 Anthropic 人工智能初创公司Anthropic推出Claude Pro高级订阅计划,提供更多使用量,与ChatGPT Plus展开竞争。

ClaudePro_Blog-2.png

要点:

1、Anthropic推出Claude Pro订阅计划,每月20美元,提供Claude2使用量的5倍。

2、Claude Pro定价与ChatGPT Plus相同,两者是竞争对手。

3、Anthropic表示Claude Pro每8小时可发送超过100条消息,ChatGPT Plus每3小时只能发送50条。

时代周刊首发全球百大AI人物:马斯克、黄仁勋、李彦宏等入选

《时代周刊》公布首届全球百大AI人物名单,包括李彦宏在内的AI行业领军人物入选。特斯拉CEO埃隆马斯克、英伟达创始人兼CEO黄仁勋以及Open AI CEO萨姆奥特曼等均榜上有名。

要点:

1. 《时代周刊》首次评选全球百大AI人物,李彦宏是中国唯一上榜的企业家。

2. 名单还包括马斯克、黄仁勋、萨姆奥特曼等国际知名AI人士。

3. 中科院曾毅、斯坦福李飞飞等思想者被评为AI行业的思想者。

举报

  • 相关推荐
  • 小度全产品矩阵亮相 AWE,看大模型时代如何让 AI 真正走进千家万户

    3月12日,中国家电及消费电子博览会(AWE2026)将在上海开幕。作为行业领先的AI助手硬件品牌,小度科技将首次携全系产品矩阵亮相,展示其“场景+AI+硬件”战略的落地成果。从智能音箱、智能屏到AI眼镜、智能摄像头等硬件,以及AI酒店、AI养老等行业解决方案,小度将呈现一个完整的AI生态。这一切的背后,是2025年底升级的“超能小度”——基于大模型打造的多模态AI智能助手,让小度产品真正具备了“看见”世界、“思考”需求的能力。在AWE现场,观众将有机会亲身体验多模态AI如何重塑家庭看护、随身办公、智能交互等场景。小度正以实际行动回答:大模型时代,AI应如何走进千家万户。

  • 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能

    随着大模型技术规模化落地,AI应用的实时性正成为企业竞争力的核心。然而,在算力持续升级的同时,模型从存储层加载至计算单元的环节却日渐成为制约系统效率与弹性的关键瓶颈。缓慢或波动的加载过程,不仅会导致昂贵算力资源的闲置,更直接影响业务响应质量。由此可见,构建高效、稳定的数据供给通道,已成为AI基础设施演进的关键方向。为验证企业级SSD在真实AI�

  • MWC首秀即焦点!讯飞AI眼镜携多模态同传大模型革新智能穿戴体验

    在2026年世界移动通信大会(MWC)上,科大讯飞以“AI Connecting Ideas”为主题,首次全球亮相其AI眼镜。该产品集多模态同传翻译与极致轻量化设计于一身,凭借领先的多模态降噪、全能翻译及多模态记录功能,吸引了众多海外运营商、技术伙伴及专业媒体的关注。其创新的唇动识别多模态降噪方案,通过摄像头捕捉说话者唇部运动,融合骨传导麦克风捕捉佩戴者声音,将音视频两路信息融合处理,在多人交谈的嘈杂背景中精准锁定目标讲话人,将语音识别和翻译的准确率提升50%以上。整机重量仅40克,相比当前市面主流同类产品重量降低了约20%,是目前全球最轻的双目单色显示多模态智能眼镜。此外,讯飞AI眼镜还具备多模态记录功能,能自动智能生成图文声并茂的会议纪要,覆盖信息记录和总结的全流程,为跨国商务人群提升工作效率。讯飞AI眼镜于北京时间3月4日上午10:10在国内电商开启预约。

  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • OpenClaw中文版Molili开放自定义大模型接入 国产AI智能体再突破

    3月5日,OpenClaw中文版Molili正式上线自定义接入大模型功能。该产品以极致自由度、全链路本土化适配与零门槛操作为特点,为个人及企业用户提供全新AI自动化解决方案,推动桌面AI智能体从“对话交互”向“落地执行”深度转型。核心亮点包括自定义大模型接入、全场景使用自由,支持企业无缝接入私有模型,个人用户可自主选择偏好模型,打破传统AI工具模型绑定限制。产品突破“重对话、轻执行”行业痛点,实现真实电脑端操作,覆盖文件处理、信息搜索等重复性任务,支持微信、钉钉等多平台远程指挥,并搭载8000+技能矩阵,全方位保障用户隐私与数据安全。

  • ​别再盲目做 AI 营销了!这款 GEO监控工具,撕开了大模型引用的“黑盒”

    本文探讨了生成式引擎优化(GEO)的重要性,并介绍了AIBase推出的GEOBase平台。文章指出,当前品牌营销的关注点已从传统SEO转向GEO,即如何让品牌在AI搜索结果中获得更高可见度。GEOBase平台通过曝光趋势、引用来源、情感得分等核心功能,帮助品牌监测在各大AI平台(如DeepSeek、豆包等)中的表现,并提供数据驱动的优化策略。文章以3C品牌为例,展示了如何利用该工具分析竞争格局、优化内容投放,从而提升品牌在AI语境下的影响力。最后,文章强调GEO是算法时代的精密计算,而GEOBase为品牌提供了关键的“体检报告”和作战地图。

  • GLM-5大模型官宣支持7大国产芯片平台:华为、寒武纪、摩尔线程等在列

    春节期间国产AI大模型轮番登场,除了DeepSeekV4还在低调之外,几家热门模型都来了,其中智谱的GLM-5是其中热度最高的之一。从智谱官网介绍来看,GLM-5重点就是提升编程与智能体能力,其参数量达到了7440亿,是上代GLM-4.X的2倍左右,性能提升很明显。GLM-5在单台国产算力节点上的性能表现,已足可媲美由两台国际主流GPU组成的计算集群,不仅如此,在长序列处理场景下,其部署成本更是大幅降低了50%。

  • 2026年GEO优化公司评测对比:基于AI大模型“认知友好度”的五维战力排位赛

    本文基于AI大模型底层逻辑,首创“AI认知友好度五维评估体系”,深入剖析了六家头部GEO服务商如何帮助企业从“被看见”跨越到“被信任”。报告指出,传统搜索引擎的“蓝色链接”霸权正在瓦解,企业竞争焦点已从“如何被百度收录”转向“如何让AI在生成答案时优先推荐我”。通过量化评估发现,数据一致性、多模态对齐和鲁棒性成为AI时代营销的三大铁律。报告为不同企业提供了选型建议,并强调GEO优化已成为品牌在AI时代保持“存在感”的战略投资。

  • 2026全球 AI 大模型 API 聚合平台服务商深度评测:企业级和开发者的首选

    本文针对2026年AI开发需求,从稳定性、价格、模型覆盖与合规性四大维度,评测了主流AI大模型API聚合平台。文章将服务商分为三类:企业级首选(如n1n.ai、Azure OpenAI)、极客尝鲜首选(如OpenRouter、SiliconFlow)以及国内镜像与中转平台。通过深度横评数据,文章指出选择时需警惕低价陷阱、模型不对版和合规发票三大问题。最终结论建议:企业/团队首选n1n.ai,因其具备企业级稳定性、1:1汇率优势及合规支持;个人极客可考虑OpenRouter;纯开源玩家则推荐SiliconFlow。

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

今日大家都在搜的词: