首页 > 业界 > 关键词  > AI直播最新资讯  > 正文

AI视野:阿里妈妈上线AI直播;多家AI绘画网站集中关闭;Stability AI发布AI音乐生成工具Stable Audio

2023-09-14 15:51 · 稿源:站长之家

🤖📱💼AI应用

Stability AI发布AI音乐生成工具Stable Audio

伦敦初创公司Stability AI发布Stable Audio,使用AI从文本生成自定义音乐和音效。该系统使用基于扩散的模型,可以在几秒内生成长达90秒的专业音频。Stable Audio的优势在于生成多风格音乐,提供友好界面,面向需要快速背景音乐的创意专业人士。

image.png

要点:

1、Stable Audio使用扩散模型从文本生成自定义音乐和音效,支持多种风格。

2、提供浏览器界面,使用简单,可在几秒内生成长达90秒的高质量音频。

3、面向需要快速获取背景音乐的电影、游戏等创意行业专业人士。

Adobe 的 Firefly 生成式 AI 工具结束测试:现已向所有订阅用户提供

Adobe宣布其Firefly生成式AI工具正式结束测试,现已向所有Creative Cloud订阅用户开放,用户可以利用AI生成图像和内容。

Adobe Firefly,萤火虫,生成式AI,人工智能,图片生成

要点:

1. Adobe Firefly生成式AI工具已正式开放给所有Creative Cloud订阅用户。

2. Firefly提供了多种AI功能,包括图像扩充、色彩校正、语音到图像等。

3. 每个用户每月将获得一定的“生成积分”限额用于AI内容生成。

Stable Diffusion发布WebUI1.6版本 对小显存用户更加友好

Stable Diffusion最近发布了1.6版本的WebUI,对小显存用户更加友好,可以直接跨入使用1.60版本的模型。

图片

要点:

1.1.6版本WebUI性能优异,小显存用户不再容易爆显存。

2. 墙裂建议所有小显存用户都升级到1.6版本。

3.1.6版本增加了很多采样器,但对画面影响似乎不大,采用DPM++采样器即可。

微软Teams AI库来了! 可帮助公司创建消息机器人

微软Teams的AI库将于10月正式投入全球运行。AI库提供各种工具,帮助开发者在Teams中轻松集成大规模语言模型,构建会话式应用,提高企业工作效率。

QQ截图20230914142408.jpg

要点:

1、 AI库包含用于创建机器人、消息扩展等工具,以及将现有应用迁移到大语言模型的工具。

2、AI库推出开发者预览版,10月面向全球发布,支持桌面和移动端。

3、AI库发布后,Teams工作协作将大规模应用AI技术,提升企业工作效率。

Trickle:利用GPT-4推理能力识别截图关键信息

Trickle是一个支持GPT-4人工智能的截图管理平台,能将杂乱截图转化为有价值的视觉备忘录。它通过AI文本生成功能为截图创建概要,深度分析内容,实现智能归类整理。用户可以用语音交互检索所需信息。

image.png

体验地址:https://www.trickle.so/

要点:

1. 智能生成截图文本概要,提高检索效率

2. 深度分析截图内容,洞察信息本质

3. 支持语音交互,快速检索所需截图

三星SDS推出Brity Copilot 、 FabriX两款生成式AI服务

三星 SDS 推出Brity Copilot和FabriX两项生成AI服务,解决RPA局限,提高企业生产力,支持多语言模型集成,可私有云或独立服务器构建。

要点:

1、三星 SDS 推出Brity Copilot和FabriX两项生成AI服务,旨在解决RPA局限,提高企业生产力。

2、Brity Copilot用于处理电子邮件、信息传递、视频会议和数据存储等业务流程中的智力工作,而FabriX是一个业务平台,集中公司数据和知识资产,为员工提供便利。

3、这些服务支持多种大型语言模型的集成,包括OpenAI的ChatGPT和Naver的HyperCLOVA X,可以构建在私有云或独立服务器上。

知网推出“AIGC检测服务系统” 可识别学术文本中AI生成内容

同方知网推出“AIGC检测服务系统”,可快速准确识别学术文本中的AI生成内容,系统支持多种检测场景,界面简洁易用,检准率较高。

微信截图_20230913173310.png

要点:

1. 系统基于知网大数据资源,使用知识增强AIGC检测技术,可以识别不同程度疑似AI生成文本。

2. 支持上传各类格式文档进行检测,可实时查看检测进度和结果报告。

3. 支持论文、学位论文、科研报告等多种学术场景的生成内容检测。

Memo AI:一个小而美的AI音视频转译工具

Memo AI是一个小而强大的AI音视频转译工具,支持本地部署,提供多项实用功能,包括视频转文字、多语言支持、实时字幕等。

image.png

体验地址:https://memo.ac/

要点:

1. 支持多语言翻译,覆盖90多种语言

2. 提供实时字幕、笔记、内容摘要等辅助功能

3. 可利用GPU加速,支持本地部署使用

Whisper API平替?Whisper Turbo语音转录速度是前者的20倍

GitHub最近发布了一款名为Whisper Turbo的新产品,作为OpenAI Whisper API的替代品,用于提供语音转录服务。其最引人关注的就是转录速度是OpenAI API的20倍。Whisper Turbo采用Rust语言开发,拥有出色的性能。它易于安装使用,支持GPU加速,是提升语音应用性能的理想选择。

image.png

项目地址:https://github.com/FL33TW00D/whisper-turbo

要点:

1. GitHub发布Whisper Turbo作为OpenAI Whisper API的替代品,转录速度快20倍。

2. Whisper Turbo使用Rust语言开发,性能出色,支持GPU加速。

3. Whisper Turbo易于安装使用,可以提升语音应用性能。

📰🤖📢AI新鲜事

多家AI绘画网站集中关闭!技术升级还是合规整改?

近日,稿定设计、即时AI、无界AI、一览运营宝、吐司TusiArt、LiblibAI、VegaAI、DraftAI、4B3等多家AI绘画网站集中关闭或更换域名,据了解是进行技术升级或整改,具体原因不明。这可能与最近出台的算法备案管理制度有关。根据新规,提供AIGC服务需完成安全评估和算法备案。监管部门正在加快对AIGC领域的管理。

image.png

要点:

1、多家AI绘画网站集中关闭或更换域名,称技术升级,但具体原因不明。

2、这可能与最近出台的算法备案管理制度有关,提供AIGC服务需备案。

3、监管部门正在加快对AIGC领域的管理,加强审核和规范。

阿里妈妈上线「AI全时直播」能力

阿里妈妈推出了「AI全时直播」能力,通过阿里妈妈创意生态「AI直播间」和阿里妈妈万相台无界版「短直联动」两大能力,帮助商家实现24小时不停播,降低直播成本,增加直播效果。

要点:

1、阿里妈妈推出「AI全时直播」能力,实现24小时不停播

2、通过「AI直播间」和「短直联动」两大能力,降低直播成本

3、AI功能如智能脚本等,可增加直播效果

ChatGPT使用数据曝光 访问量和编程需求自5月开始持续下滑

SparkToro公布数据分析结果显示,ChatGPT的使用量和编程协助需求自5月份以来呈明显下降趋势。自5月份以来,ChatGPT官方网站OpenAI.com的月访问量已经下降了29%。更值得注意的是,使用ChatGPT进行编程协助的比例也下降了30%。

要点:

1、自5月份以来,ChatGPT官方网站访问量下降29%,编程协助使用下降30%,表明ChatGPT的热潮正在减退。

2、分析显示编程协助是ChatGPT的主要用途,占29%,其他用途包括教育、内容创作、知识查询、销售和营销等。

3、尽管ChatGPT在编程协助方面表现强劲,但随着用户了解其功能和局限性,长期吸引力存在不确定性,其持久性有待观察。

加州议员提议规范AI模型

加州议员Scott Wiener提出法案,要求AI模型开发商达到透明度标准。该提案计划建立加州AI研究所,在AI安全风险方面进行测试。Wiener的目标是启动关于如何监管AI的讨论。

网络安全 隐私 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 加州议员Scott Wiener提出法案,要求AI模型开发商达到透明度标准。

2. 该提案计划建立加州AI研究所,在AI安全风险方面进行测试。

3. Wiener的目标是启动关于如何监管AI的讨论。

马斯克呼吁成立人工智能联邦部门

特斯拉CEO埃隆·马斯克在国会山人工智能峰会后呼吁成立联邦人工智能部门,认为这次高调的技术领袖和研究人员峰会可能成为人类文明史上的重要会议。

xAI,马斯克,人工智能,AI

要点:

1. 埃隆·马斯克在峰会后表示人工智能发展潜在危害人类,呼吁成立类似FAA的联邦人工智能部门。

2. 本次峰会云集包括OpenAI、谷歌等科技公司CEO,讨论AI监管问题。

3. 出席者认为需要加强AI安全监管,但监管细节还存在分歧。

欧盟将向人工智能初创公司开放超级计算机资源

欧盟计划向人工智能初创公司开放超级计算机资源,以帮助它们训练AI模型,但需要初创公司加入欧盟的AI治理框架。欧盟委员会主席警告AI发展速度太快,存在风险,呼吁建立机构评估AI风险。

要点:

1. 欧盟计划开放超级计算机资源,助力人工智能初创公司训练AI模型。

2. 欧盟要求初创公司加入AI治理框架,以获取使用权限。

3. 欧盟委员会主席警告AI发展过快,呼吁建立机构评估AI风险。

17名医生束手无策3年未诊断 ChatGPT准确诊断孩子的慢性疼痛

一名母亲带儿子见过17名医生但未能确诊慢性头痛原因,后将症状输入ChatGPT,ChatGPT正确诊断出罕见病脊髓栓系综合症。

AI研究 AI医疗 医生

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 儿子头痛3年,母亲带儿子见过17名专家,但都无法确诊。

2. 母亲将症状输入ChatGPT,ChatGPT诊断出罕见病脊髓栓系综合症。

3. 医生验证ChatGPT诊断正确,为儿子进行了手术治疗。

👨‍💻💡🎯聚焦开发者

Floneum开源:适用于 LLM 工作流程的图形编辑器!

Floneum是一个面向本地AI和社区插件的图形化工作流编辑器,提供简单的图形界面,无需编程就可以组合运行插件和本地AI模型。

image.png

项目地址:https://github.com/floneum/floneum

要点:

1、Floneum具备图形化工作流界面,使用简单,无需编程即可组合运行插件和本地AI模型。

2、支持本地运行大型语言模型,保障用户隐私和数据安全。

3、开放的插件系统,可以自定义模型行为,提升性能和效果。

用 AI 打造有无穷变化的人生重开模拟器

日前,公众号南瓜博士介绍了一款名为"人生重开模拟器"的伪代码 prompt,旨在通过这个 prompt 来模拟玩家的人生经历,并让 GPT-3自动根据玩家的选择和属性值生成相关事件,最终生成玩家一生的故事。这个伪代码 prompt 的目的是使人们更容易创建具有逻辑的虚拟体验,同时探索了如何使用伪代码和自然语言混合编写。

image.png

要点:

1、作者介绍了名为"人生重开模拟器"的伪代码 prompt,目的是通过这个 prompt 模拟玩家的人生经历,生成玩家一生的故事,以及探索伪代码和自然语言混合编写的方法。

2、文章展示了模拟器的不同版本,从最初的纯伪代码到包含真实代码和伪代码的混合版本,讨论了属性分配、事件生成和属性更新等模拟器的不同部分。

3、作者提出了改进方向,如开局选择天赋卡、使用随机词汇生成事件、添加成就,并介绍了提高稳定性的方法,为构建具有逻辑和互动性的虚拟体验提供了有价值的思路和灵感。

Chupa:使用2D 扩散概率模型雕刻3D 穿衣人体

Chupa是一种新的3D人体生成方法,它将扩散模型与神经渲染相结合,可以生成逼真且多样化的3D人体。Chupa的创新之处在于它从SMPL-X网格生成高质量的人体网格。具体来说,它首先使用扩散模型生成人体法线贴图,然后基于法线贴图进行3D重建,还采用了扩散重采样以提升全身和面部的质量。Chupa可以轻松推广到各种姿势,并显示真实的质量。

image.png

项目地址:https://snuvclab.github.io/chupa/

要点:

1. Chupa使用扩散模型生成人体法线贴图,然后进行基于法线的3D重建。

2. Chupa采用扩散重采样提升身体和面部区域的质量。

3. Chupa可以轻松地推广到各种姿势,生成真实逼真的3D人体。

🤖📈💻💡大模型动态

腾讯 AI Lab联合多家学术机构发布大模型幻觉问题评估

腾讯AI Lab联合多家学术机构发布了面向大模型幻觉问题的综述文章。研究将大模型幻觉分为三类,当前研究重点是与事实知识冲突的幻觉。相比传统模型,大模型幻觉评估面临数据规模大、模型通用性强、幻觉不易察觉等新难题。为减少幻觉,可从多个方面进行干预,但仍存在可靠评估等挑战。

image.png

  • 论文链接:https://arxiv.org/abs/2309.01219

  • Github 链接:https://github.com/HillZhang1999/llm-hallucination-survey

要点:

1、大模型幻觉主要分为与输入、上下文及事实冲突的三类,研究热点在第三类。

2、相比传统模型,大模型幻觉评估面临数据规模大、通用性强、不易察觉等新难题。

3、缓解幻觉可从预训练、微调、强化学习、推理等方面入手,但仍有可靠评估等挑战。

举报

  • 相关推荐
  • AI享生活 一连即发 三星AI神 冰箱带来智慧厨居新体验

    三星AI神冰箱通过SmartThings APP实现全屋智能互联,用户可远程管理食材、获取菜谱推荐、同步追剧音乐。搭载AI大屏智能识别食材种类并自动更新清单,支持节电模式与用电量查询。冰箱从食材管理到烹饪灵感提供全方位智慧体验,成为智能家居的核心环节,让厨房生活更便捷高效。

  • 为什么AI搜索会“抛弃”传统SEO?

    AI搜索正颠覆传统搜索生态,用户从“找链接”转向“得答案”。传统SEO三大策略失效:首页排名概念消失,关键词堆砌失效,外链权重减弱。新时代GEO(生成引擎优化)关注内容结构化、权威性和语义丰富度。建议使用AIBase等工具监测品牌在AI回答中的曝光率,通过优化内容质量提升被引用概率。这是从流量竞争到信任度构建的范式转移。

  • “AI家教”火了,哪家大厂领跑?

    各大应用榜单刚刚公布的9月数据,揭示出一个AI应用新风向——教育类AI应用正加速崛起。 多家机构的数据显示,这一赛道的月活用户(MAU)与下载量双双上涨,部分产品涨幅甚至逼近1000%。 以非凡产研的数据为例,好课帮助教育旗下的“光速写作”凭借场景定位与功能体验,月环比下载增速高达926.59%,科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计,月活跃用�

  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

  • 品牌被AI主动提及 = 流量新入口? 11 步让你的品牌在AI答案中露脸(含工具推荐)

    在AI问答时代,用户习惯直接提问而非浏览网页,品牌若未出现在AI回答中将错失曝光机会。文章提出生成式引擎优化(GEO)概念,强调提升品牌在AI回答中的提及率是关键。核心策略包括:创建结构化、专业可信的内容;借助权威来源增强引用;优化网页技术确保可抓取;持续更新数据保持时效性。推荐使用AIBase工具量化监测提及率,通过11步实操策略系统性提升品牌在AI生态中的可见度与影响力。

  • AI 搜索时代,SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

    AI搜索时代,传统SEO面临三大变革:用户行为从点击链接转向AI直接生成答案,搜索入口从索引排名转向生成式引用,内容机制更注重权威性与结构化数据。SEO并未消亡,而是进化——需聚焦可引用内容、结构化优化、多平台布局。推荐使用AIBase GEO工具监测被AI引擎引用情况,核心目标从"排名第一"转向"被AI优先选中"。

  • AI +游戏,何以撑起百亿市场?

    今年以来,生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上,使用生成式AI技术的游戏数量呈现出惊人增长,激增了800%。行业预测显示,在今年新上市的游戏中,这一应用比例预计将达到20%。 游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

  • AI时代品牌营销致胜秘诀:用数据驱动GEO优化,让AI排名持续在线

    当DeepSeek、豆包、文心一言等AI助手成为10亿用户的信息入口,品牌面临生死抉择:要么出现在AI推荐中,要么彻底消失。文章指出,AI营销与传统SEO完全不同,是一场没有终点的动态竞赛,需要持续投入和调整。品牌需建立“监测-分析-优化”闭环机制,使用专业工具实时监控排名波动,快速响应算法迭代和用户提问变化。成功关键在于让AI“看见”并“信任”品牌,通过补充权威数据、多媒体内容、长尾语义覆盖等方式提升可信度,在流量红利期抢占先机。

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • GEO怎么做?AI 挑选引用内容的标准是什么?

    本文探讨生成式引擎优化(GEO)的核心策略,指出AI引用内容遵循五大标准:权威性(40%权重)、结构化程度(25%)、时效性(20%)、内容深度(10%)和用户意图匹配度(5%)。相较于传统SEO,GEO旨在让AI主动引用并推荐内容,而非仅提升搜索排名。文章提出六步实战方案:诊断现状、逆向分析竞品、创建AI友好模板、技术优化、建立引用飞轮及持续迭代,并强调避免机械堆砌关键词、忽视内容更新等误区。随着40%年轻用户首选AI工具搜索,提前布局GEO将成为获取流量的关键。

今日大家都在搜的词: