首页 > 业界 > 关键词  > AI直播最新资讯  > 正文

AI视野:阿里妈妈上线AI直播;多家AI绘画网站集中关闭;Stability AI发布AI音乐生成工具Stable Audio

2023-09-14 15:51 · 稿源:站长之家

🤖📱💼AI应用

Stability AI发布AI音乐生成工具Stable Audio

伦敦初创公司Stability AI发布Stable Audio,使用AI从文本生成自定义音乐和音效。该系统使用基于扩散的模型,可以在几秒内生成长达90秒的专业音频。Stable Audio的优势在于生成多风格音乐,提供友好界面,面向需要快速背景音乐的创意专业人士。

image.png

要点:

1、Stable Audio使用扩散模型从文本生成自定义音乐和音效,支持多种风格。

2、提供浏览器界面,使用简单,可在几秒内生成长达90秒的高质量音频。

3、面向需要快速获取背景音乐的电影、游戏等创意行业专业人士。

Adobe 的 Firefly 生成式 AI 工具结束测试:现已向所有订阅用户提供

Adobe宣布其Firefly生成式AI工具正式结束测试,现已向所有Creative Cloud订阅用户开放,用户可以利用AI生成图像和内容。

Adobe Firefly,萤火虫,生成式AI,人工智能,图片生成

要点:

1. Adobe Firefly生成式AI工具已正式开放给所有Creative Cloud订阅用户。

2. Firefly提供了多种AI功能,包括图像扩充、色彩校正、语音到图像等。

3. 每个用户每月将获得一定的“生成积分”限额用于AI内容生成。

Stable Diffusion发布WebUI1.6版本 对小显存用户更加友好

Stable Diffusion最近发布了1.6版本的WebUI,对小显存用户更加友好,可以直接跨入使用1.60版本的模型。

图片

要点:

1.1.6版本WebUI性能优异,小显存用户不再容易爆显存。

2. 墙裂建议所有小显存用户都升级到1.6版本。

3.1.6版本增加了很多采样器,但对画面影响似乎不大,采用DPM++采样器即可。

微软Teams AI库来了! 可帮助公司创建消息机器人

微软Teams的AI库将于10月正式投入全球运行。AI库提供各种工具,帮助开发者在Teams中轻松集成大规模语言模型,构建会话式应用,提高企业工作效率。

QQ截图20230914142408.jpg

要点:

1、 AI库包含用于创建机器人、消息扩展等工具,以及将现有应用迁移到大语言模型的工具。

2、AI库推出开发者预览版,10月面向全球发布,支持桌面和移动端。

3、AI库发布后,Teams工作协作将大规模应用AI技术,提升企业工作效率。

Trickle:利用GPT-4推理能力识别截图关键信息

Trickle是一个支持GPT-4人工智能的截图管理平台,能将杂乱截图转化为有价值的视觉备忘录。它通过AI文本生成功能为截图创建概要,深度分析内容,实现智能归类整理。用户可以用语音交互检索所需信息。

image.png

体验地址:https://www.trickle.so/

要点:

1. 智能生成截图文本概要,提高检索效率

2. 深度分析截图内容,洞察信息本质

3. 支持语音交互,快速检索所需截图

三星SDS推出Brity Copilot 、 FabriX两款生成式AI服务

三星 SDS 推出Brity Copilot和FabriX两项生成AI服务,解决RPA局限,提高企业生产力,支持多语言模型集成,可私有云或独立服务器构建。

要点:

1、三星 SDS 推出Brity Copilot和FabriX两项生成AI服务,旨在解决RPA局限,提高企业生产力。

2、Brity Copilot用于处理电子邮件、信息传递、视频会议和数据存储等业务流程中的智力工作,而FabriX是一个业务平台,集中公司数据和知识资产,为员工提供便利。

3、这些服务支持多种大型语言模型的集成,包括OpenAI的ChatGPT和Naver的HyperCLOVA X,可以构建在私有云或独立服务器上。

知网推出“AIGC检测服务系统” 可识别学术文本中AI生成内容

同方知网推出“AIGC检测服务系统”,可快速准确识别学术文本中的AI生成内容,系统支持多种检测场景,界面简洁易用,检准率较高。

微信截图_20230913173310.png

要点:

1. 系统基于知网大数据资源,使用知识增强AIGC检测技术,可以识别不同程度疑似AI生成文本。

2. 支持上传各类格式文档进行检测,可实时查看检测进度和结果报告。

3. 支持论文、学位论文、科研报告等多种学术场景的生成内容检测。

Memo AI:一个小而美的AI音视频转译工具

Memo AI是一个小而强大的AI音视频转译工具,支持本地部署,提供多项实用功能,包括视频转文字、多语言支持、实时字幕等。

image.png

体验地址:https://memo.ac/

要点:

1. 支持多语言翻译,覆盖90多种语言

2. 提供实时字幕、笔记、内容摘要等辅助功能

3. 可利用GPU加速,支持本地部署使用

Whisper API平替?Whisper Turbo语音转录速度是前者的20倍

GitHub最近发布了一款名为Whisper Turbo的新产品,作为OpenAI Whisper API的替代品,用于提供语音转录服务。其最引人关注的就是转录速度是OpenAI API的20倍。Whisper Turbo采用Rust语言开发,拥有出色的性能。它易于安装使用,支持GPU加速,是提升语音应用性能的理想选择。

image.png

项目地址:https://github.com/FL33TW00D/whisper-turbo

要点:

1. GitHub发布Whisper Turbo作为OpenAI Whisper API的替代品,转录速度快20倍。

2. Whisper Turbo使用Rust语言开发,性能出色,支持GPU加速。

3. Whisper Turbo易于安装使用,可以提升语音应用性能。

📰🤖📢AI新鲜事

多家AI绘画网站集中关闭!技术升级还是合规整改?

近日,稿定设计、即时AI、无界AI、一览运营宝、吐司TusiArt、LiblibAI、VegaAI、DraftAI、4B3等多家AI绘画网站集中关闭或更换域名,据了解是进行技术升级或整改,具体原因不明。这可能与最近出台的算法备案管理制度有关。根据新规,提供AIGC服务需完成安全评估和算法备案。监管部门正在加快对AIGC领域的管理。

image.png

要点:

1、多家AI绘画网站集中关闭或更换域名,称技术升级,但具体原因不明。

2、这可能与最近出台的算法备案管理制度有关,提供AIGC服务需备案。

3、监管部门正在加快对AIGC领域的管理,加强审核和规范。

阿里妈妈上线「AI全时直播」能力

阿里妈妈推出了「AI全时直播」能力,通过阿里妈妈创意生态「AI直播间」和阿里妈妈万相台无界版「短直联动」两大能力,帮助商家实现24小时不停播,降低直播成本,增加直播效果。

要点:

1、阿里妈妈推出「AI全时直播」能力,实现24小时不停播

2、通过「AI直播间」和「短直联动」两大能力,降低直播成本

3、AI功能如智能脚本等,可增加直播效果

ChatGPT使用数据曝光 访问量和编程需求自5月开始持续下滑

SparkToro公布数据分析结果显示,ChatGPT的使用量和编程协助需求自5月份以来呈明显下降趋势。自5月份以来,ChatGPT官方网站OpenAI.com的月访问量已经下降了29%。更值得注意的是,使用ChatGPT进行编程协助的比例也下降了30%。

要点:

1、自5月份以来,ChatGPT官方网站访问量下降29%,编程协助使用下降30%,表明ChatGPT的热潮正在减退。

2、分析显示编程协助是ChatGPT的主要用途,占29%,其他用途包括教育、内容创作、知识查询、销售和营销等。

3、尽管ChatGPT在编程协助方面表现强劲,但随着用户了解其功能和局限性,长期吸引力存在不确定性,其持久性有待观察。

加州议员提议规范AI模型

加州议员Scott Wiener提出法案,要求AI模型开发商达到透明度标准。该提案计划建立加州AI研究所,在AI安全风险方面进行测试。Wiener的目标是启动关于如何监管AI的讨论。

网络安全 隐私 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 加州议员Scott Wiener提出法案,要求AI模型开发商达到透明度标准。

2. 该提案计划建立加州AI研究所,在AI安全风险方面进行测试。

3. Wiener的目标是启动关于如何监管AI的讨论。

马斯克呼吁成立人工智能联邦部门

特斯拉CEO埃隆·马斯克在国会山人工智能峰会后呼吁成立联邦人工智能部门,认为这次高调的技术领袖和研究人员峰会可能成为人类文明史上的重要会议。

xAI,马斯克,人工智能,AI

要点:

1. 埃隆·马斯克在峰会后表示人工智能发展潜在危害人类,呼吁成立类似FAA的联邦人工智能部门。

2. 本次峰会云集包括OpenAI、谷歌等科技公司CEO,讨论AI监管问题。

3. 出席者认为需要加强AI安全监管,但监管细节还存在分歧。

欧盟将向人工智能初创公司开放超级计算机资源

欧盟计划向人工智能初创公司开放超级计算机资源,以帮助它们训练AI模型,但需要初创公司加入欧盟的AI治理框架。欧盟委员会主席警告AI发展速度太快,存在风险,呼吁建立机构评估AI风险。

要点:

1. 欧盟计划开放超级计算机资源,助力人工智能初创公司训练AI模型。

2. 欧盟要求初创公司加入AI治理框架,以获取使用权限。

3. 欧盟委员会主席警告AI发展过快,呼吁建立机构评估AI风险。

17名医生束手无策3年未诊断 ChatGPT准确诊断孩子的慢性疼痛

一名母亲带儿子见过17名医生但未能确诊慢性头痛原因,后将症状输入ChatGPT,ChatGPT正确诊断出罕见病脊髓栓系综合症。

AI研究 AI医疗 医生

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 儿子头痛3年,母亲带儿子见过17名专家,但都无法确诊。

2. 母亲将症状输入ChatGPT,ChatGPT诊断出罕见病脊髓栓系综合症。

3. 医生验证ChatGPT诊断正确,为儿子进行了手术治疗。

👨‍💻💡🎯聚焦开发者

Floneum开源:适用于 LLM 工作流程的图形编辑器!

Floneum是一个面向本地AI和社区插件的图形化工作流编辑器,提供简单的图形界面,无需编程就可以组合运行插件和本地AI模型。

image.png

项目地址:https://github.com/floneum/floneum

要点:

1、Floneum具备图形化工作流界面,使用简单,无需编程即可组合运行插件和本地AI模型。

2、支持本地运行大型语言模型,保障用户隐私和数据安全。

3、开放的插件系统,可以自定义模型行为,提升性能和效果。

用 AI 打造有无穷变化的人生重开模拟器

日前,公众号南瓜博士介绍了一款名为"人生重开模拟器"的伪代码 prompt,旨在通过这个 prompt 来模拟玩家的人生经历,并让 GPT-3自动根据玩家的选择和属性值生成相关事件,最终生成玩家一生的故事。这个伪代码 prompt 的目的是使人们更容易创建具有逻辑的虚拟体验,同时探索了如何使用伪代码和自然语言混合编写。

image.png

要点:

1、作者介绍了名为"人生重开模拟器"的伪代码 prompt,目的是通过这个 prompt 模拟玩家的人生经历,生成玩家一生的故事,以及探索伪代码和自然语言混合编写的方法。

2、文章展示了模拟器的不同版本,从最初的纯伪代码到包含真实代码和伪代码的混合版本,讨论了属性分配、事件生成和属性更新等模拟器的不同部分。

3、作者提出了改进方向,如开局选择天赋卡、使用随机词汇生成事件、添加成就,并介绍了提高稳定性的方法,为构建具有逻辑和互动性的虚拟体验提供了有价值的思路和灵感。

Chupa:使用2D 扩散概率模型雕刻3D 穿衣人体

Chupa是一种新的3D人体生成方法,它将扩散模型与神经渲染相结合,可以生成逼真且多样化的3D人体。Chupa的创新之处在于它从SMPL-X网格生成高质量的人体网格。具体来说,它首先使用扩散模型生成人体法线贴图,然后基于法线贴图进行3D重建,还采用了扩散重采样以提升全身和面部的质量。Chupa可以轻松推广到各种姿势,并显示真实的质量。

image.png

项目地址:https://snuvclab.github.io/chupa/

要点:

1. Chupa使用扩散模型生成人体法线贴图,然后进行基于法线的3D重建。

2. Chupa采用扩散重采样提升身体和面部区域的质量。

3. Chupa可以轻松地推广到各种姿势,生成真实逼真的3D人体。

🤖📈💻💡大模型动态

腾讯 AI Lab联合多家学术机构发布大模型幻觉问题评估

腾讯AI Lab联合多家学术机构发布了面向大模型幻觉问题的综述文章。研究将大模型幻觉分为三类,当前研究重点是与事实知识冲突的幻觉。相比传统模型,大模型幻觉评估面临数据规模大、模型通用性强、幻觉不易察觉等新难题。为减少幻觉,可从多个方面进行干预,但仍存在可靠评估等挑战。

image.png

  • 论文链接:https://arxiv.org/abs/2309.01219

  • Github 链接:https://github.com/HillZhang1999/llm-hallucination-survey

要点:

1、大模型幻觉主要分为与输入、上下文及事实冲突的三类,研究热点在第三类。

2、相比传统模型,大模型幻觉评估面临数据规模大、通用性强、不易察觉等新难题。

3、缓解幻觉可从预训练、微调、强化学习、推理等方面入手,但仍有可靠评估等挑战。

举报

  • 相关推荐
  • 阿里夸克AI眼镜S1发布春节版本更新:支持第一视角直播

    阿里巴巴旗下首款自研旗舰双显AI眼镜——夸克AI眼镜S1迎来重大更新,正式升级至1.5.1版本。此次升级新增第一视角直播、截录屏快捷分享等实用功能,并优化了多项用户体验。升级后,用户可轻松调用眼镜内置摄像头进行第一视角直播,实现所见即所播;同时引入截录屏快捷分享功能,支持实时抓取显示内容或实景照片视频,一键分享至社区或主流社交平台。新版本还支持问答回复固定显示、应景音乐推荐、点头接听电话等功能,并优化了偏暗环境下的拍摄效果,提升了3K视频的拍摄质量。

  • 钉钉AI群聊全面升级!每个群聊配备专属助理AI小钉

    2月6日,阿里钉钉发布8.2.10版本,宣布全面升级钉钉AI群聊。新版本为每个钉钉群配备专属AI助手“AI小钉”,实现全天候在线响应。AI小钉已上线三大功能:个性化资讯中枢、群动态智能管家、自然语言群管理。其中,群动态智能管家可定时汇总群内关键信息,自动生成日报/周报摘要,并智能识别未完成任务,定时定向提醒负责人跟进。用户只需在新建的钉钉内部群@AI小钉,即可通过自然语言对话查询聊天记录、管理任务、调整群设置等。存量钉钉内部群的群主和管理员可在群设置中添加配置AI小钉为群机器人,开启使用。

  • 打造一站式AI服务中心,这次淘宝用AI重构服务

    当一件三年前购买的冲锋衣被用户寄回,破损的口子,意味着一段户外旅程的终结。大多数商家看到的,或许是一笔需要计算的维修成本。但专业户外品牌拓路者看到了不同的东西——一个用服务兑现品牌承诺,将一次性的维修成本,转化为消费者终身信任的机会。 他们通过AI知识库匹配合适的面料批次,由老师傅修复如初,当衣服寄回时,用户留言:“我以为品牌承诺止于下

  • 闪极Loomos L1 AI拍摄眼镜:架构革新+全链路AI,助力智能穿戴升级

    闪极科技推出旗舰级Loomos L1 AI拍摄眼镜,以创新架构和前沿功能重新定义智能眼镜标准。其搭载全新凤凰架构,采用4纳米四核ARM主处理器与专业蓝牙Soc的双芯组合,解决了初代产品通话卡顿、画质不佳等问题。首创摄像头与前框解耦设计,将索尼1200万像素CMOS融入镜腿,兼顾卓越拍摄效果与美观。产品采用钛合金复合板材框架,鼻梁体感重量控制在20克以内,并提供多种时尚框型与配色。核心AI功能革新包括独家VAD主动人声识别算法,可实现全天候自动录音、拍照、录像,并实时上传云端分析,形成个人记忆库。此外,隐形镜头盖设计可一秒遮蔽摄像头,平衡拍摄便捷与隐私安全。配合多功能换电仓与降噪聚音旗等配件,满足不同场景需求。闪极L1以其极致佩戴体验和全链路AI赋能,成为内容创作者、生活记录者及办公协同者的智能伴侣。

  • 春节AI牌局,阿里跟注30亿

    互联网习惯了用短期让利换取用户行为迁移的打法,AI也染上了相似的毛病。 2月2日,阿里巴巴旗下千问APP宣布投入30亿启动春节攻势,全面接入淘宝闪购、大麦、飞猪、盒马等生态业务,以免单形式请全国用户在春节期间吃喝玩乐,并将在2月6日上线。

  • AI日报:字节发布超强视频模型Seedance2.0;小红书秘密研发AI剪辑器OpenStoryline;神秘AI模型“Pony Alpha”曝光

    本期AI日报聚焦多领域进展:字节跳动发布视频生成模型Seedance2.0,显著降低视频制作门槛;小红书研发AI视频剪辑工具OpenStoryline,支持对话式编辑;千问APP推出免单卡功能,便利年货采购;顶级域名AI.com以7000万美元成交,刷新历史纪录;神秘模型Pony Alpha因高性能免费引发关注,身份存疑;OpenAI首款AI硬件“Dime”智能耳机曝光,预计2026年发布;苹果CarPlay将支持第三方语音助手,提升交互体验;阿里新一代开源模型Qwen3.5代码现身,或为原生视觉语言模型,即将发布。

  • 千问AI购物订单9小时破1000万 创造AI购物新历史

    阿里千问APP推出春节30亿免单活动,上线9小时AI订单破千万,用户已发出超3000万次“帮我买”指令。该活动推动APP登顶苹果免费榜,形成“千元豆”格局。用户可通过AI下单奶茶、生鲜百货及年货,全国盒马门店陆续接入。此举刷新阿里春节投入纪录,成为AI春节大战中金额最大、AI含量最高的战略攻势,旨在培养全民AI使用习惯,开启AI生活购物新时代。

  • AI的答案,不在敲钟那天

    过去几天,中国AI产业迎来了一个历史性时刻。 智谱于1月8日登陆港交所,以“全球大模型第一股”之名敲钟,另一位玩家MiniMax紧随其后,于隔日挂牌交易。 两家国产大模型玩家,在极短时间内相继上市,显然点燃了市场情绪——智谱上市当日市值迅速逼近数百亿港元,认购倍数被推至极高水平;MiniMax首日股价大幅上扬,估值一举跨过千亿门槛。 钟声落定,变化亦在悄然酝�

  • 理想AI,步入深水区

    种一棵树,最好的时间是十年前,其次是现在。 在2024理想AI Talk中,李想曾表示一定会做具身智能,但“节奏不是现在”:L4自动驾驶的汽车还解决不了,怎么去解决更复杂的? 尽管如今看来或许还没到完美的时机,但理想还是决定踏出这一步。据21世纪经济报道,1月26日,李想召开线上全员会,全程几乎不谈汽车,只谈AI,强调2026是所有想要成为AI头部公司上车的最后一年,最

  • 钛动科技助力品牌远征:从“场域复制”到“心智解码”的直播出海

    全球直播电商正以前所未有的速度扩张,预计2025年市场规模将突破2万亿美元。然而,品牌出海面临“无形门槛”急剧升高,文化差异导致用户获取成本上涨40%-65%。成功关键在于从“区域复制”转向“心智解码”,即深入理解目标市场的文化符号与情感叙事,实现本土化价值连接。系统化能力构建成为破局之道,需整合达人资源、内容创新与本地运营,通过数据驱动的场景创新(如虚拟场景A/B测试)优化直播效果。未来,AI驱动的自适应直播系统将实现个性化体验,虚实融合场景打破物理界限,全球供应链与直播实时联动,最终编织一张感知文化温差、适应市场节奏的全球直播网络。

今日大家都在搜的词: