首页 > 业界 > 关键词  > 灵境矩阵最新资讯  > 正文

AI视野:百度推出“灵境矩阵”;阿里通义千问正式开放;美图秀秀推出AI滤镜

2023-09-13 15:06 · 稿源:站长之家

🤖📈💻💡大模型动态

百度推出文心大模型插件开发平台“灵境矩阵

百度发布面向开发者的文心大模型插件开发平台“灵境矩阵”,提供生产赋能、分发贯通、商业共生三大核心能力。该平台将帮助开发者快速打造优质的插件产品,为他们提供流量分发通路,以及更多的推广资源和渠道,实现商业价值的拓展。

微信截图_20230913135125.png

要点:

1、平台提供低成本的平台接入能力和生产力工具,帮助开发者快速打造出优质的插件产品。

2、平台将提供流量分发通路,让开发者的产品触达更多用户。

3、平台将与开发者共同打包商业能力和运营能力,帮助开发者将产品拓展到更多行业领域。

阿里云通义千问大模型正式向全社会开放

阿里云宣布通义千问大模型通过备案,正式向公众开放,广大用户可在官网体验,企业用户可以通过阿里云调用通义千问API。广大用户可登录通义千问官网(https://qianwen.aliyun.com/)体验,企业用户可以通过阿里云调用通义千问API(https://dashscope.console.aliyun.com/model)。

要点:

1. 阿里云宣布通义千问大模型已首批通过备案,正式向公众开放。

2. 广大用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。

3. 通义千问开启邀测一个月内,超20万企业和机构用户申请接入测试。

蓝色光标发布营销行业模型 “Blue AI”

蓝色光标发布了营销行业模型“Blue AI”,整合了专业作业模式和内容沉淀,结合微软云、百度、智谱AI等技术,引领营销行业进入智能化时代。

微信截图_20230913085646.jpg

要点:

1、聚焦内容生成、思维助手和体验创新三大场景;

2、实现特定人机协作方式融入大模型;

3、与合作伙伴共建行业生态。

读书郎将推出 AI 学习机或搭载梦想教育大模型

国内知名教育科技智能硬件品牌读书郎在其官方微博上发布了三张图片,并配以话题标签“读书郎梦想教育大模型”和“AI 学习机”,此举可被视为读书郎公司即将开始研发自己的大模型的公开声明。

微信截图_20230913085955.png

要点:

1. 读书郎CEO秦曙光强调,大模型技术在教育领域具有重要作用。

2. 读书郎教育科技将积极参与大模型技术在教育领域的发展。

3. 读书郎将为广大学生和教育者提供更加前沿和个性化的学习体验。

👨‍💻💡🎯聚焦开发者

华人团队推出Medusa简单框架 可将LLM推理速度提高2倍

来自普林斯顿、UIUC等机构的华人团队提出Medusa框架,可以将大型语言模型的生成效率提高约2倍。

image.png

项目地址:https://github.com/FasterDecoding/Medusa

要点:

1. Medusa是一个简单的框架,在原有语言模型上新增解码头,以并行预测提高生成速度。

2. Medusa可以为Vicuna系列模型带来约2倍的加速,非贪婪生成比贪婪解码还快。

3. 研究人员正在扩展Medusa的应用场景,以获得更高的性能提升。

Adept AI开源8亿参数语言模型Persimmon-8B

Anthropic公司最近开源了Persimmon-8B,这是目前参数量少于10亿的完全免许可使用的最强大语言模型。

image.png

要点:

1. Anthropic公司开源了Persimmon-8B,这是目前参数量少于10亿的最强大的完全免许可语言模型

2. 该模型具有16K的上下文长度,超过了LLaMA2的4倍和GPT-3的8倍

3. 提供了灵活快速的推理代码,在一块A100GPU上可以每秒生成56个token

超强大放大和恢复模型DiffBIR 减少模糊并锐化图像细节

DiffBIR是一个利用生成对抗网络进行盲图像复原的开源项目,能够在不需要对应的高质量图像的情况下,对低质量图像进行去噪、超分辨率以及颜色校正等复原。

image.png

项目地址:https://github.com/XPixelGroup/DiffBIR

要点:

1. DiffBIR使用两阶段网络结构,第一阶段去除低级图像退化,第二阶段使用类似Stable Diffusion的模型作为先验引导输出高质量图像。

2. 支持人脸图像和普通场景图像的复原,效果明显优于传统算法。

3. 模型和代码完全开源,支持用户自定义训练和开发,可广泛应用于图像复原领域。

OnPrem.LLM :可轻松在本地运行大语言模型的Python包

OnPrem.LLM是一个Python包,它可帮助用户在本地机器上使用非公开数据运行大型语言模型,受privateGPT和LLM命令行工具启发,旨在推动LLM在本地环境中的实际应用。

image.png

项目地址:https://github.com/amaiya/onprem

要点:

1. 支持在本地运行不同语言模型,无需上传数据到云端。

2. 提供文本生成功能,可进行问答、对话等。

3. 支持GPU加速,大大提高响应速度。

📰🤖📢AI新鲜事

苹果在iPhone15中悄悄应用了AI技术

苹果在最新一代iPhone和苹果手表中悄悄应用了人工智能技术,通过改进芯片设计提供动力,以提高基本功能如拍照、接听来电等,与其他公司大肆宣传人工智能不同。

Apple-iPhone-15-Pro,苹果

要点:

1. 苹果手表新芯片加入神经网络引擎,提高了语音助手Siri精度。

2. 新款iPhone摄像头可自动识别人像进行模糊背景处理。

3. 双指互点手势可控制苹果手表操作,无需触碰屏幕。

小米:AI声音识别算法性能在国际上排名第一

小米宣布其自研声音识别算法在国际排名中取得第一,该算法在Google发布的音频标记任务中表现最好,并被广泛应用于小米的智能设备中。

微信截图_20230913111342.png

要点:

1. 小米声音识别算法在国际排名中位居第一,在Google音频标记任务取得突破。

2. 该算法广泛应用于小米智能手机、音箱、摄像头等设备,提升了智能化程度。

3. 应用实例包括小米闻声功能、宝宝哭声监测等,为用户提供更人性化的智能体验。

AI获奖名画申请版权被拒!作者624次提示打造

美国一位AI画作的作者Jason Allen为自己的获奖AI画作《太空歌剧院》申请版权被美国版权局拒绝,理由是该画AI含量过高,作者认为创作过程中包含足够人类创造力应该受版权保护。

image.png

要点:

1. Jason Allen为自己的获奖AI画作《太空歌剧院》申请版权,被美国版权局以AI含量过高为由拒绝。

2. Jason Allen认为画作的创作过程包含了他本人的大量创造力投入,不应该因为仅由AI生成就不受版权保护。

3. 这表明AI创作的版权问题在法律模糊地带仍有较大争议,需要进一步讨论界定创作过程中人类创造力的界限。

IBM、Adobe等9家公司加入白宫人工智能安全承诺

最近,Adobe、IBM、Nvidia等9家人工智能公司向白宫承诺开发安全可靠的人工智能,这是拜登政府与人工智能公司达成的第二项此类协议。

AI机器人上班

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. Adobe、IBM、Nvidia等9家公司加入了此前与白宫达成安全承诺的公司行列。

2. 这些公司承诺在商业发布AI系统前进行测试,投资保护模型权重安全,与政府和其他组织分享风险管理信息。

3. 这些都是自愿承诺,反映AI公司与政府加强合作,推动AI的负责任发展。

腾讯大股东Prosus为投资公司开发AI聊天机器人

荷兰电子商务投资公司Prosus为其所投资公司开发了AI聊天机器人PlusOne,以应对越来越多科技企业使用这种新兴技术简化运营。

AI聊天机器人

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. Prosus为投资公司开发AI聊天机器人PlusOne,使用OpenAI软件,作为员工“私人助理”。

2. Prosus是腾讯控股最大股东,持有腾讯约26%股份,计划将持股比例降至24%-25%。

3. 越来越多科技企业开始使用AI聊天机器人等新兴技术来简化运营。

可口可乐利用SD模型创造了最新口味Y3000零糖

可口可乐推出了名为“可口可乐Y3000零糖”的新饮料,据称是与人工智能共同开发的限量版产品,采用了Stable Diffusion等技术进行品牌和包装设计,强调未来和乐观的氛围。

y3000_204x3.png

图片来自Coca‑Cola

要点:

1. 可口可乐开发了一款名为“可口可乐Y3000零糖”的新口味饮料,宣称是与AI共同创作的限量版产品。

2. 通过Stable Diffusion等技术生成包装和品牌视觉设计,营造未来主义的氛围。

3. 饮料将在美国、加拿大、中国等市场上限量发布,与AI合作主要作为噱头和营销手段。

🤖📱💼AI应用

美图秀秀推出“AI滤镜”功能 可快速复制优质滤镜效果

美图秀秀推出“AI滤镜”功能,通过智能学习参考图片的色调和样式,可以帮助用户快速复制和获取心仪的照片滤镜效果。

微信截图_20230913084814.png

要点:

1. AI滤镜可自动学习导入图片的滤镜,复制其效果。

2. 智能推荐参考图片,用户收藏复用。

3. 整个过程简便易操作,无需专业知识。

超赞!Emoji AI可为任何文本生成酷炫emoji表情

EmojiAI.com是一个人工智能emoji建议工具,用户只需输入文字,它就可以根据内容推荐相关emoji,为社交媒体帖子增加趣味性和吸引力。

image.png

体验地址:https://emojiai.com/

要点:

1. EmojiAI.com会根据输入文本的语义、情感等因素推荐相关emoji。

2. 它可以提升自媒体内容和营销文案的趣味性和吸引力。

3. 使用简单,输入文本后直接生成精准的emoji建议。

颠覆性产品!HelpKit AI可将Notion知识库转化为全天候智能助手

HelpKit AI是一款创新的产品,它可以将Notion知识库转化为一个智能的、全天候的AI助手,为您的用户提供准确且即时的回答。这意味着用户无需等待人工客服的回应,而是可以直接通过AI助手获取所需的答案。

image.png

项目地址:https://www.helpkit.so/helpkit-ai

要点:

1. HelpKit AI使用GPT模型,可以针对客户的知识库内容进行训练,实现智能问答等功能。

2. 它可以以弹出窗口或搜索栏的形式嵌入知识库网站,为用户提供人性化交互。

3. 用户只需提问,它就可以在知识库中检索最佳回答。它让客户支持变得更智能、自动化。

智能语音笔记工具AudioNotes 可将语音和无结构文本转化为文本摘要

AudioNotes是一款基于AI的语音笔记应用,可以自动生成结构化文本摘要。主要功能有:录音/上传音频、摘要偏好设置、编辑修改、智能语音转文字等。

image.png

体验地址:https://www.audionotes.app/

要点:

1. 支持录音和上传音频文件自动生成摘要

2. 可自定义摘要语言、文体和长度

3. 提供编辑修改生成的录音转文字和摘要

举报

  • 相关推荐
  • 极氪接入通义千问3,知识库问答命中率达98%

    极氪汽车接入通义千问3大模型,打造专属知识库"极氪知道",问答准确率达98%。基于阿里云平台调用Qwen3-235B-A22B大模型,构建图文视三位一体的知识呈现系统,可提供标准化文本介绍及多媒体资源。通义千问3的快慢思考融合架构能提供更富逻辑性的车辆对比介绍,提升客户决策体验。极氪车联网、APP等核心业务已运行在阿里云平台。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 阿里云首款AI原生开发环境工具AI IDE上线:适配千问3 可调用3000多款工具

    AI IDE还全面支持长期记忆、行间建议预测(NES-Next Edit Suggestion)、行间会话(Inline Chat)等能力,为开发者带来更丝滑、更智能的编程体验。 据悉,在通义灵码AI IDE上线后,通义灵码拥有插件和IDE两种产品形态。 深度融入开发者工作流,实现从辅助编码到沉浸式智能开发的跨越,全面覆盖开发者的工作场景。

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 一场没有“罗永浩”的直播,为百度AI正名

    5500万GMV,这可能是迄今为止,一个AI数字人单次直播带来的最高销量。 过去几年内,数字人直播代替真人主播的传言总是一波又一波,空无一人的直播基地无数手机屏幕“自动地”产生着GMV,这个画面曾经击中了无数网友的心。但现实是,这些数字人们机械重复的动作、无法随机应变的话术反而让真人主播们都松了一口气。 但这次,真正的转折点来了。6月15日,罗永浩数字�

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • 球迷体验再升级!IBM为温网推出AI驱动的实时互动及结果预测

    2025年温网将引入AI助手"Match Chat"和增强版"Likelih ood to Win"预测工具。球迷可通过温网App实时提问获取比赛分析,AI系统基于IBM watsonx平台构建,整合赛事数据和语言模型技术。预测工具将根据球员表现动态更新胜率分析。全英草地网球俱乐部表示,这些创新旨在为全球球迷提供更沉浸式的观赛体验。IBM强调这是双方35年合作的最新成果,通过AI技术拉近球迷与赛事�

  • 百度网盘位列AI产品榜APP第一,AI激活网盘内容管理、消费新增量

    6月3日AI产品榜显示,百度网盘APP月活用户超1.5亿,位列国内应用总榜第一、全球总榜第二,仅次于ChatGPT。百度网盘已推出AI笔记、听记、扫描、打印等多项功能,覆盖生活娱乐、学习办公等场景。百度文库在AI内容创作赛道排名第一。百度网盘与文库联合推出的"AI笔记"上线一个月用户达500万,被高校学生称为"备考神器"。此外,百度还发布了全球首个内容操作系统"沧舟OS",整合了网盘和文库的海量数据。数据显示,百度网盘AI月活用户超8000万,文库AI月活超9700万,已成为大模型时代的领先AI产品。

  • 小米预告AI眼镜 雷军:自带小爱同学 啥都能直接问

    近日,小米科技正式宣布,其全新智能穿戴设备——小米AI眼镜将于明晚正式发布。雷军在社交媒体上发文,将这款眼镜定位为面向下一个时代的个人智能设备,强调其作为随身AI入口的独特价值,并承诺将为用户带来诸多前所未有的体验。 雷军进一步透露了小米AI眼镜的部分功能亮点。据悉,该眼镜内置了小米智能语音助手小爱同学,结合眼镜自带的镜头,用户只需通过语音