首页 > 业界 > 关键词  > 千帆大模型最新资讯  > 正文

AI视野:百度千帆大模型适配Falcon-180B;OpenAI将举行首届开发者大会;微软测试新版画图工具

2023-09-08 14:47 · 稿源:站长之家

>>>>>>大模型动态<<<<<<

蚂蚁发布金融大模型 针对金融产业深度定制

蚂蚁集团在外滩大会上发布了自主研发的金融大模型,该模型在语言理解、生成、专业知识等多个维度取得显著进步,已经在蚂蚁旗下的财富、保险等平台内测,同时发布了基于该模型的智能金融助理“支小宝2.0”和业务助手“支小助”两款产品。

微信截图_20230908161439.png

要点:

1、蚂蚁集团发布自主研发的金融大模型,该模型达到万级卡规模,在多个金融专属任务上表现优异。

2、金融大模型已经在蚂蚁集团的财富、保险等平台上全面内测。

3、发布了基于该模型的智能金融助理“支小宝2.0”和业务助手“支小助”两款产品。

百度智能云千帆大模型平台适配开源大模型Falcon-180B

百度智能云千帆大模型平台宣布率先适配开源大模型Falcon-180B,提供全流程工具链和开发环境,帮助企业和开发者体验应用这一最新大模型能力。

微信截图_20230908135033.png

要点:

1、百度智能云千帆大模型平台适配开源大模型Falcon-180B

2、提供全流程工具链和开发环境

3、方便企业和开发者体验和应用Falcon-180B

喜马拉雅推出白酒SIVA营销模型

喜马拉雅推出白酒SIVA营销模型,通过内容生态和人群运营策略满足不同白酒品牌的营销需求,覆盖消费决策链路的各个阶段。

微信截图_20230908141006.png

要点:

1. 喜马拉雅白酒SIVA营销模型具有品牌故事定制、声音广告、播客内容合作等10余种营销工具。

2. 模型通过消费者画像和行为数据洞察用户需求,帮助白酒品牌进行差异化定位。

3. SIVA模型策略覆盖消费决策链路的多个阶段,提升品牌全链路经营效能。

百川智能大模型API将于9月20日上线

百川智能宣布其大模型API将于9月20日正式上线,用户可以直接申请调用。此前,百川智能在9月6日举行的大模型发布会上正式开源了 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 以及其4bit 量化版本,并且免费可商用。

微信截图_20230908115245.png

Baichuan2下载地址:https://github.com/baichuan-inc/Baichuan2

要点:

1. 百川智能大模型API将于9月20日上线。

2. 用户可以直接申请调用百川智能大模型API。

3. 百川智能此前已经开源了多个通用大语言模型,包括Baichuan2-7B、Baichuan2-13B等。

>>>>>>AI应用<<<<<<

微软测试新版画图工具,增加一键去除背景AI功能

微软正在测试新版画图工具,该工具允许用户一键去除图像背景。新功能已推出给Windows Insiders,Canary和Dev Channels可体验。这一改进将使画图工具更加实用,减少了用户使用第三方应用的需要。

image.png

要点:

1. 微软正在测试新版画图工具,该工具允许用户一键去除图像背景。

2. 新功能已推出给Windows Insiders,Canary和Dev Channels可体验。

3. 这一改进将使画图工具更加实用,减少了用户使用第三方应用的需要。

eBay推出AI生成工具,卖家上传图片即可生成产品列表

eBay推出AI生成工具,卖家上传产品图片后,该工具可自动生成产品标题、描述和分类信息,旨在简化卖家的销售流程,尤其对新手卖家更为友好,但也存在生成文本质量参差不齐的问题。

image.png

要点:

1. eBay的新AI工具可以通过卖家上传的产品图片自动生成标题、描述等信息。

2. 该工具简化了销售流程,对新手卖家更为友好。

3. 生成的文字质量并不统一,部分卖家对此提出不满。

AI文档阅读神器司马阅 通过聊天方式帮你精准获取关键信息

司马阅是一款基于 AI 技术的智能文档助手,可以上传 PDF、Word 等多种格式文档,通过语音或文字与文档进行交互,快速定位关键信息。

image.png

体验地址:https://smartread.cc/

要点:

1.通过深度学习技术,司马阅可以提取关键句子、重点内容,自动生成文档摘要,大幅提升工作学习效率。

2.用户可以用语音或文字提问,快速获取要点。

3.该工具广泛应用于合同审阅、论文阅读、报告撰写等场景,助力专业人士事半功倍。

>>>>>>>聚焦开发者<<<<<<

重磅!新语言Mojo开放下载,运行速度超Python6.8万倍

新语言Mojo开放编译器和IDE下载,语法类Python但运行速度可达Python的6.8万倍,这在开发社区引起了轰动。

image.png

要点:

1. Mojo通过类型注释、向量化、多核并行等手段大幅提升运行速度。

2. Mojo兼容Python生态,可与Numpy、Pandas等库无缝交互,受到AI开发者关注。

3. Mojo的创始人是LLVM和Swift语言的创造者,他认为Mojo不是来取代Python,而是给Python开发者带来超强性能。

清华提出4比特优化器 显著减少LLaMA微调的显存需求

针对优化器状态的量化方法,将优化器状态的数值精度降低至4比特,在多个微调任务中实现接近全精度优化器的性能,可将LLaMA微调的显存需求减少超过50%。

image.png

要点:

1、针对优化器状态的量化方法,将优化器状态的数值精度降低至4比特

2、提出了针对一阶矩和二阶矩的量化策略,处理了零点问题等难点

3、在多个微调任务中达到全精度优化器的性能,同时可将LLaMA微调的显存需求减少超过50%

YaRN:可高效扩展现有大模型的上下文窗口长度

YaRN是一种计算高效的方法,可以扩展基于transformer的语言模型的上下文窗口,与以前的方法相比,它需要10倍更少的token和2.5倍更少的训练步骤。

image.png

项目地址:https://github.com/jquesnelle/yarn

要点:

1、YaRN利用了旋转位置嵌入(RoPE)来增强模型处理顺序数据和获取位置信息的能力,同时通过压缩变压器来扩展上下文窗口。

2、YaRN只需要400个训练步骤就能成功实现语言模型的上下文窗口扩展,相比之前的方法降低了10倍的训练样本量和2.5倍的训练步骤。

3、YaRN改进了所有现有的RoPE插值方法,以无缺点和最小的实施努力替换了PI,微调后的模型在多个基准上保持了原有的能力。

Doppelgangers:通过学习算法区分相似结构的图像

Doppelgangers是一个通过学习算法区分视觉高度相似但物理上不同3D表面图像的方法。

image.png

论文地址:https://doppelgangers-3d.github.io/

要点:

1. 构建包含大量正负样本的图像区分数据集Doppelgangers。

2. 设计网络架构,以局部特征和匹配分布作为输入判断是否为同一3D表面。

3. 可集成到3D重建流程中,过滤错误匹配提高重建质量。

>>>>>>>AI新鲜事<<<<<<

OpenAI将于11月6日举办首届开发者大会,将展示最新技术和想法

OpenAI将于11月6日在旧金山举办首届开发者大会OpenAIDevDay。会上将预览新工具并交流想法,具体内容待公布。此举旨在向开发者展示最新成果,也是OpenAI的一个营销机会。

ChatGPT OpenAI  人工智能 (1)

要点:

OpenAI将于11月6日举办首届开发者大会,将预览新工具和交流想法。

开发者大会上,OpenAI团队将主持主题演讲和小组讨论。

此举对OpenAI来说是一个营销机会,以推动其商业成功。

微软宣布为商业客户提供新的 Copilot 版权承诺:将承担潜在法律风险

微软公司宣布,如果商业客户因使用其人工智能产品Copilot生成的内容遭侵权诉讼,微软将承担法律责任。微软表示,只要客户使用了Copilot中的内置防护措施,公司将承担第三方的任何潜在诉讼风险。

Windows Copilot,微软,人工智能,AI

要点:

1. 微软承诺承担Copilot商业用户的潜在法律风险。

2. 条件是商业用户要使用Copilot内置的防护措施。

3. 微软此举是应对版权持有人对AI生成内容的担忧。

用人伪装AI?热门AI初创公司Kaedim虚假宣传其3D模型生成技术

据404Media报道,AI初创公司Kaedim虚假宣传其3D图像生成技术,声称可自动从2D图生成3D模型,但实际上公司雇佣艺术家直接绘制高质量3D图像,没有使用AI。

image.png

要点:

1. Kaedim声称其技术可以自动从2D图像生成高质量3D模型,其创始人因此入选了福布斯30位30岁以下精英的榜单。

2. 但实际上,Kaedim的AI生成的3D图像质量很差,有时只是不成形的一堆线条。

3. 根据两名知情人透露,Kaedim有时直接让艺术家完全从零开始绘制高质量3D图像,而没有使用任何AI技术。

ChatGPT Plus强劲对手来了!Anthropic推付费订阅计划 Claude Pro

谷歌支持的由前 OpenAI 员工共同创立的 Anthropic 人工智能初创公司Anthropic推出Claude Pro高级订阅计划,提供更多使用量,与ChatGPT Plus展开竞争。

ClaudePro_Blog-2.png

要点:

1、Anthropic推出Claude Pro订阅计划,每月20美元,提供Claude2使用量的5倍。

2、Claude Pro定价与ChatGPT Plus相同,两者是竞争对手。

3、Anthropic表示Claude Pro每8小时可发送超过100条消息,ChatGPT Plus每3小时只能发送50条。

时代周刊首发全球百大AI人物:马斯克、黄仁勋、李彦宏等入选

《时代周刊》公布首届全球百大AI人物名单,包括李彦宏在内的AI行业领军人物入选。特斯拉CEO埃隆马斯克、英伟达创始人兼CEO黄仁勋以及Open AI CEO萨姆奥特曼等均榜上有名。

要点:

1. 《时代周刊》首次评选全球百大AI人物,李彦宏是中国唯一上榜的企业家。

2. 名单还包括马斯克、黄仁勋、萨姆奥特曼等国际知名AI人士。

3. 中科院曾毅、斯坦福李飞飞等思想者被评为AI行业的思想者。

举报

  • 相关推荐
  • 以善为帆,为爱远航 —— 如新中国 “善的力量月” 交出暖心答卷

    如新中国"善的力量月"公益活动温暖开展,围绕儿童成长推出多项爱心举措。志愿者在北京、上海等地开展"童心绘梦"活动,为孩子们绘制帆布包、水杯等物品;"如新小学"项目23年来持续助学,今年走访15所合作学校,捐赠11万元书籍和文体用品;"新启航教育计划"为贵州、湖南等地困境学生提供心理辅导和职业技能培训。活动吸引全国近300位事业经营伙伴自发参与,通过物资捐赠和心理关怀,让善意在更多孩子心中生根发芽。如新公益品牌宣传片《声生不息》展现受助者的真实改变,传递"聚善汇力"理念。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 如何快速精准计算AI大模型费用?试试这个三步完成的免费工具!

    文章讲述AI项目预算失控的普遍现象:李工团队因手动计算GPT-4等大模型调用成本复杂,最终预算比实际支出少25%。行业调查显示73%团队曾因模型成本失控被迫调整项目。AIbase推出三步极速成本计算器解决痛点:1)集成50+主流大模型参数库;2)用自然语言描述需求即可生成预算;3)10秒输出详细成本对比报告。该工具已帮助电商企业节省40%预算,其优势在于实时追踪官方定价、智能匹配场景规则、自动生成多模型对比报告,让晦涩的token计价变得直观透明。目前已有超12万开发者使用该工具优化AI项目成本。

  • 如何用3分钟精准计算AI大模型成本?避免生成一篇万字文章就超支?

    AI大模型成本控制指南:实测三步预算法+企业级避坑方案。文章揭露行业痛点:1)价格迷雾:各厂商计费规则差异大,长文本/多模态存在隐藏溢价;2)团队实测GPT-4生成20篇行业分析(50万字)实际账单超预算4倍。解决方案:通过AIbase计算器实现精准预测:①场景化选择自动加载计费规则;②输入需求实时生成动态成本矩阵;③智能规避四大隐性成本(长文本衰减补偿/区域差价预警等)。跨境电商案例显示,使用工具后成本降低60%。核心观点:在AI时代,成本控制能力已成为企业核心竞争力。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • 大模型技术赋能声音创作:逗哥配音引领AI语音合成新浪潮‌

    逗哥配音作为国内领先的AI配音平台,凭借自主研发的语音合成大模型技术,已服务超千万创作者,累计生成音频量突破270亿次。其核心技术突破包括:1)支持40种语言,语音质量MOS分提升0.25,拟人度超83%;2)首创"AI分角功能",将多角色配音效率提升90%以上;3)建成覆盖近千款发音人的全球声库,包含方言、外语及影视角色音;4)创新"真人声纹+AI增强"模式,

  • 独家消息:天玑9500 AI算力翻倍,大模型响应速度更快了

    联发科天玑9500完成NPU架构升级,首次引入全新IP硬件。采用“存算一体”高效设计,AI策略从拼性能转向追求均衡能效比。终端AI落地能力增强,旗舰芯片算力提升让手机可运行更聪明的大模型,响应更迅速。日常AI功能如图像处理、视频生成、文本创作等响应更快效果更好。“存算一体”技术通过就地计算降低功耗,减少数据传输更节能。手机AI技术正从“实验室性能”向“用户体验”过渡,算力提升带来更广泛AI应用场景,能效优化保障日常使用稳定性,整体提升手机AI实用价值。

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

  • 聚焦制造业智能化转型 中国科学技术大学依托昇腾突破知识增强大模型关键技术

    中国科学技术大学宋骞团队基于昇腾平台开发了工业知识图谱构建框架和大模型增强推理技术。该研究通过融合领域小模型与大语言模型,构建了"初始识别-知识抽取-知识引导反思"三阶段框架,显著提升了知识抽取准确性。在智能运维系统应用中,团队采用ETL架构处理多模态数据,结合RDF语义网技术构建知识图谱,并研发故障智能预测诊断模块。同时创新性地提出知识增强与过滤框架,利用PLM嵌入空间降低计算负担,有效提升知识增强的灵活性。研究成果显著提升了工业设备智能运维水平,实现了核心技术的自主创新适配,为构建安全高效的现代工业体系提供关键技术支撑。

今日大家都在搜的词: