首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

AI视野:腾讯“混元大模型”正式发布;Midjourney正开发V6版本;Hugging Face推新服务Training Cluster

2023-09-07 13:52 · 稿源:站长之家

>>>>>>>>>>>>大模型动态<<<<<<<<<<<<

世界最强开源大模型Falcon180B引爆全网 性能直逼商业模型

阿布扎比研究中心TII开源超大模型Falcon180B,参数达1800亿,性能超LLaMA2,与GPT-3.5和PaLM2不相上下。

QQ截图20230907172806.jpg

项目地址:https://huggingface.co/tiiuae/falcon-180B-chat

要点:

1.Falcon180B在3.5万亿token训练下,参数1800亿,位居Hugging Face开源模型榜首。

2.Falcon180B在多项NLP基准测试中表现强劲,超过LLaMA2,与GPT-3.5和PaLM2接近。

3.Falcon180B可免费商用,提供聊天版本,任何人都可以试用体验。

腾讯“混元大模型”正式发布 参数规模超千亿

在今日的腾讯数字生态大会上,腾讯汤道生宣布正式发布混元大模型,参数规模超千亿,预训练语料超2万亿tokens,可以提供强大的中文创作能力、复杂语境下的逻辑推理能力和可靠的任务执行能力,目前已落地腾讯多个核心业务场景。

微信截图_20230907093825.png

要点:

1. 混元大模型参数规模超千亿,预训练语料超2万亿tokens。

2. 可以提供强大的中文创作、逻辑推理和任务执行能力。

3. 已落地腾讯广告、搜索等多个核心业务场景。

百川智能开源Baichuan2均可免费商用

百川智能发布了两款开源大模型 Baichuan2-7B 和 Baichuan2-13B,参数分别为70亿和130亿,能力全面超越了 Meta 研发的 Llama2-13B 模型。同时,百川智能还发布了Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。

微信截图_20230906173411.png

项目地址:github.com/baichuan-inc/Baichuan2

要点:

1. 百川智能发布开源大模型Baichuan2-7B和Baichuan2-13B,参数规模分别为70亿和130亿。

2. Baichuan2全面超越了Meta研发的Llama2-13B模型,提升了数学、代码、安全、逻辑等多方面能力。

3. 百川智能还发布了Baichuan2-13B的对话和量化版本,所有模型均可免费商用。

>>>>>>>>>>>>>聚焦开发者<<<<<<<<<<<<

Hugging Face推出新服务Training Cluster 可一键训练模型

Hugging Face推出新服务Training Cluster,用户仅需一键即可对模型进行训练,无需处理复杂的内部过程。这项创新服务将极大地减少用户在深度学习项目中进行模型训练所需的时间和精力。

image.png

项目地址:https://huggingface.co/training-cluster

要点:

1、Training Cluster支持一键对模型进行训练,简化内部流程

2、提供GPU资源进行大规模语言模型定制训练

3、降低AI技术应用门槛,有助推动AI普及和发展

Meta推全新纯C++分割引擎SAM.cpp 支持图像、视频等精细分割

Meta公司推出了全新的C++图像分割引擎SAM.cpp,支持对图像、视频进行精细语义分割。该项目现已在GitHub上开源,底层基于GGML模型格式实现高效推理。其主要功能包括:载入PyTorch训练的分割模型;使用ggml格式加载参数;支持命令行调参;含GUI示例等。SAM.cpp的开源有助开发者构建基于分割的创新应用。

image.png

项目地址:https://github.com/YavorGIvanov/sam.cpp

要点:

1. Meta公司推出C++语义分割引擎SAM.cpp,支持图像、视频分割

2. SAM.cpp项目已在GitHub开源,使用GGML模型格式

3. SAM.cpp功能包括:PyTorch模型加载、ggml参数加载、命令行调参等

中国版HuggingFace要来了?始智AI开源社区平台wisemodel上线

始智AI团队打造的中立开放AI开源社区平台(wisemodel.cn)正式上线,该平台汇聚了多个高质量的AI模型,包括清华大学的ChatGLM、Stable Diffusion等。它的目标是打造一个开放的AI算法和模型的社区平台。

要点:

1、wisemodel平台汇聚了chatglm、Stable Diffusion等高质量AI模型

2、目标是打造中国版的HuggingFace开源社区平台

3、注册后可以创建组织,发布自己的模型和数据集

开源工具OpenTF 提供代码、资源图等功能

开源工具OpenTF提供了基础设施即代码、执行计划、资源图等功能,可以帮助开发者以声明性方式管理云基础设施,提高管理效率。

image.png

项目地址:https://github.com/opentffoundation/opentf

要点:

1. OpenTF允许基础设施配置使用高级别配置语法进行描述,可以进行版本控制和复用。

2. OpenTF可以生成执行计划,避免执行时的意外情况。

3. OpenTF可以构建资源关系图,支持高效地构建和修改云基础设施。

>>>>>>>>>>>>>>AI应用<<<<<<<<<<<<<<

40人一年赚2亿美元!Midjourney团队爆料正开发V6版本!

TheInformation援引消息称,Midjourney公司年收入达2亿美元,仅40名员工,正开发V6版本以提高图像质量,并致力于实时生成视频和3D资产,未来可能实现整个视频游戏的生成。

机器人画画

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. Midjourney在没有投资者的情况下每年产生2亿美元的收入,这表明人工智能服务可以盈利。

2. Midjourney通过Discord平台提供的AI图像服务,单月收费从10至120美元不等。

3. 公司计划推出V6版本,同时致力于实时生成视频和3D资产,创始人预测未来可能生成整个视频游戏。

Salesforce推出Slack AI,支持未读消息摘要等功能

Salesforce推出Slack AI功能,集成生成式AI到工作流程,提供频道回顾、会话摘要等功能,以提升工作效率。

image.png

要点:

1. Slack AI将引入频道回顾、会话摘要等功能,帮助用户快速获取关键信息。

2. 搜索答案功能将应用生成式AI,以自然语言提问获取答案。

3. Slack还将推出列表和工作流构建器,集成管理任务和自动化流程。

谷歌DeepMind开始研发类似Auto-GPT的自主AI代理

谷歌DeepMind计划研究自主语言代理,这类代理通过即时工程、自我提示和内存等技术,使系统能够自主实现给定的目标,但仍需进行更多安全性研究。

image.png

要点:

1. 谷歌DeepMind计划研究自主语言代理,潜在地提升了类似Gemini的大型语言模型的应用。

2. 自主语言代理的基本思想是通过即时工程、自我提示和内存等技术,使代理系统能够自主实现给定的目标。

3. 自主AI代理引发了对齐研究人员的担忧,他们强调在开发这类代理之前需要进行更多的安全性研究。

简单、高效的AI视频编辑器Clippah 一键制作精美视频

Clippah 是一款人工智能视频编辑器,能够提供快速、简单和高效的视频编辑体验。Clippah 强大的算法能够自动裁剪视频、调整相机、音效和颜色,从而节省用户大量的时间和精力。用户可以利用 Clippah 轻松创建和编辑高质量的视频内容。

image.png

体验地址:https://www.clippah.co/

要点:

1. Clippah 可自动裁剪视频、调整相机、音效和颜色,大幅提高视频编辑效率。

2. Clippah 提供简单强大的视频编辑工具,包括自动裁剪、调整镜头、添加音乐等。

3. Clippah 易于上手使用,即使没有视频编辑经验的用户也能快速制作精美视频。

>>>>>>>>>>>>>>AI新鲜事<<<<<<<<<<<<<<

词典网站Dictionary.com加入LLM、GPT等AI新词汇

词典网站Dictionary.com最近加入了一系列与人工智能相关的新词汇,如生成式人工智能、GPT、LLM等,以跟上语言的演变,还对“幻觉”一词进行了扩展定义,并计划在秋季进一步增加新词条和定义。

image.png

要点:

Dictionary.com加入生成式人工智能、GPT、LLM等新词汇。

扩展定义“幻觉”,涉及AI生成虚假信息。

秋季计划增加大量新词条和定义。

外滩大会今日开幕 生成式AI成为热议话题

2023外滩大会于9月7日在上海开幕,本届大会以“科技·创造可持续未来”为主题,聚焦人工智能等前沿科技,以开放的组织形式推动科技领域交流合作。

要点:

大会设有主论坛、见解论坛、科技展览、绿色集市等,云端线上线下联动,近20位两院院士参会。

大会关注社会责任、风险应对、数据隐私等话题,首次举办科技人才招聘会。

大会聚焦人工智能、大模型、抗量子密码、隐私计算、图计算、安全智能、区块链、Web3.0等前沿数字科技及产业实践

举报

  • 相关推荐
  • GEO排名查询工具推荐:霸屏AI大模型答案的核心方法,做好AI大模型排名优化

    随着AI大模型成为用户获取信息的主要入口,AIBase推出GEO排名查询工具,帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示,可精准分析品牌是否被推荐、出现频次及具体场景,为制定AI大模型排名优化策略提供数据支撑。在GEO时代,抢占AI回答推荐位意味着获得全新流量入口。

  • AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

    本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

  • 深度解读丨悠然无界大模型BLM-1.0:跨空间、跨任务与跨本体泛化的里程碑

    9月28日,悠然大模型BLM-1.0完成迭代升级并全面开源。该模型突破数字与物理世界壁垒,实现跨空间迁移、跨任务学习与跨本体泛化能力,以统一模型覆盖多种机器人平台。在空间理解、推理与执行评估中综合超越同规模SOTA方法,支持工业制造、智慧城市等场景应用,推动空间智能生态共建。

  • 考拉悠然开源悠然无界大模型BLM-1.0,以空间智能引擎驱动产业变革

    9月28日,在成都举行的“2025天府人工智能产业生态大会”上,考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源,同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略,推动空间智能产业生态共建。BLM-1.0突破传统模型局限,具备跨空间、跨任务、跨本体的“三跨”统一能力,在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互,实现工业运维、安装巡检等场景的全程自动化与智能辅助,显著提升效率并降低成本。

  • 2025数贸会 | 每日互动:大数据+大模型,重塑营销价值

    9月26日,全球数字生态大会在杭州举行,聚焦AI与大数据如何重塑营销价值。每日互动朱晓鸣提出,企业需转变思维,从数据中洞察价值而非仅追求数据量,并介绍了“大数据联合计算模式”以平衡合规与营销增效。大会还推出AI营销产品AITA助手,结合大数据与行业经验,为品牌提供智能策略,助力降本增效,推动营销新纪元。

  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • AI日报:京东物流推出超脑大模型2.0;DeepSeek V3.1终结版发布;Kimi 推出全新 Agent 模式

    本期AI日报聚焦多领域技术突破:京东物流发布“超脑大模型2.0”与“异狼具身智能机械臂系统”,推动物流行业迈向自主执行;DeepSeek推出V3.1终结版,修复漏洞并为V4架构铺路;Kimi上线Agent模式“OK Computer”,支持智能网站开发等复杂任务;ChatGPT新增个性化资讯功能,定制用户专属新闻;Exa Code发布代码索引工具,助力AI代理精准生成代码;Meta推出AI视频创作平台Vibes,简化短视频制作;蚂蚁数科发布隐私保护AI框架Gibbon,推理速度提升超百倍;OpenAI新基准测试显示GPT-5在多个行业逼近人类专家水平,覆盖九大行业44种职业。

  • 推荐国内优势智驾:Momenta凭借飞轮大模型,带来极致流畅的驾驶体验

    Momenta作为国内智能驾驶领域的领先者,凭借其创新的飞轮大模型技术,实现了端到端的自动驾驶解决方案。该技术将感知与规划整合,有效解决长尾问题,提升系统可靠性和稳定性。其R6飞轮大模型采用强化学习,具备持续进化能力,适应复杂路况。Momenta与宝马、奥迪等全球主流车企深度合作,方案已成功应用于广汽丰田、东风日产等车型,并在欧洲、澳大利亚等市场落地,展现出强大的全球适应性和技术优势。选择Momenta,即选择了经过验证的可靠技术和持续升级的智能驾驶体验。

  • 我国首个政务大模型安全国家标准发布 百度深度参与制定

    日前,我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》(下称《规范》)正式发布。百度作为核心参编单位,凭借其在人工智能安全及政务服务领域的深厚积累,深度参与了该标准的制定工作,为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头,联合百度等国内领先企业共同制定�

今日大家都在搜的词: