首页 > 业界 > 关键词  > 灵境矩阵最新资讯  > 正文

AI视野:百度推出“灵境矩阵”;阿里通义千问正式开放;美图秀秀推出AI滤镜

2023-09-13 15:06 · 稿源:站长之家

🤖📈💻💡大模型动态

百度推出文心大模型插件开发平台“灵境矩阵

百度发布面向开发者的文心大模型插件开发平台“灵境矩阵”,提供生产赋能、分发贯通、商业共生三大核心能力。该平台将帮助开发者快速打造优质的插件产品,为他们提供流量分发通路,以及更多的推广资源和渠道,实现商业价值的拓展。

微信截图_20230913135125.png

要点:

1、平台提供低成本的平台接入能力和生产力工具,帮助开发者快速打造出优质的插件产品。

2、平台将提供流量分发通路,让开发者的产品触达更多用户。

3、平台将与开发者共同打包商业能力和运营能力,帮助开发者将产品拓展到更多行业领域。

阿里云通义千问大模型正式向全社会开放

阿里云宣布通义千问大模型通过备案,正式向公众开放,广大用户可在官网体验,企业用户可以通过阿里云调用通义千问API。广大用户可登录通义千问官网(https://qianwen.aliyun.com/)体验,企业用户可以通过阿里云调用通义千问API(https://dashscope.console.aliyun.com/model)。

要点:

1. 阿里云宣布通义千问大模型已首批通过备案,正式向公众开放。

2. 广大用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。

3. 通义千问开启邀测一个月内,超20万企业和机构用户申请接入测试。

蓝色光标发布营销行业模型 “Blue AI”

蓝色光标发布了营销行业模型“Blue AI”,整合了专业作业模式和内容沉淀,结合微软云、百度、智谱AI等技术,引领营销行业进入智能化时代。

微信截图_20230913085646.jpg

要点:

1、聚焦内容生成、思维助手和体验创新三大场景;

2、实现特定人机协作方式融入大模型;

3、与合作伙伴共建行业生态。

读书郎将推出 AI 学习机或搭载梦想教育大模型

国内知名教育科技智能硬件品牌读书郎在其官方微博上发布了三张图片,并配以话题标签“读书郎梦想教育大模型”和“AI 学习机”,此举可被视为读书郎公司即将开始研发自己的大模型的公开声明。

微信截图_20230913085955.png

要点:

1. 读书郎CEO秦曙光强调,大模型技术在教育领域具有重要作用。

2. 读书郎教育科技将积极参与大模型技术在教育领域的发展。

3. 读书郎将为广大学生和教育者提供更加前沿和个性化的学习体验。

👨‍💻💡🎯聚焦开发者

华人团队推出Medusa简单框架 可将LLM推理速度提高2倍

来自普林斯顿、UIUC等机构的华人团队提出Medusa框架,可以将大型语言模型的生成效率提高约2倍。

image.png

项目地址:https://github.com/FasterDecoding/Medusa

要点:

1. Medusa是一个简单的框架,在原有语言模型上新增解码头,以并行预测提高生成速度。

2. Medusa可以为Vicuna系列模型带来约2倍的加速,非贪婪生成比贪婪解码还快。

3. 研究人员正在扩展Medusa的应用场景,以获得更高的性能提升。

Adept AI开源8亿参数语言模型Persimmon-8B

Anthropic公司最近开源了Persimmon-8B,这是目前参数量少于10亿的完全免许可使用的最强大语言模型。

image.png

要点:

1. Anthropic公司开源了Persimmon-8B,这是目前参数量少于10亿的最强大的完全免许可语言模型

2. 该模型具有16K的上下文长度,超过了LLaMA2的4倍和GPT-3的8倍

3. 提供了灵活快速的推理代码,在一块A100GPU上可以每秒生成56个token

超强大放大和恢复模型DiffBIR 减少模糊并锐化图像细节

DiffBIR是一个利用生成对抗网络进行盲图像复原的开源项目,能够在不需要对应的高质量图像的情况下,对低质量图像进行去噪、超分辨率以及颜色校正等复原。

image.png

项目地址:https://github.com/XPixelGroup/DiffBIR

要点:

1. DiffBIR使用两阶段网络结构,第一阶段去除低级图像退化,第二阶段使用类似Stable Diffusion的模型作为先验引导输出高质量图像。

2. 支持人脸图像和普通场景图像的复原,效果明显优于传统算法。

3. 模型和代码完全开源,支持用户自定义训练和开发,可广泛应用于图像复原领域。

OnPrem.LLM :可轻松在本地运行大语言模型的Python包

OnPrem.LLM是一个Python包,它可帮助用户在本地机器上使用非公开数据运行大型语言模型,受privateGPT和LLM命令行工具启发,旨在推动LLM在本地环境中的实际应用。

image.png

项目地址:https://github.com/amaiya/onprem

要点:

1. 支持在本地运行不同语言模型,无需上传数据到云端。

2. 提供文本生成功能,可进行问答、对话等。

3. 支持GPU加速,大大提高响应速度。

📰🤖📢AI新鲜事

苹果在iPhone15中悄悄应用了AI技术

苹果在最新一代iPhone和苹果手表中悄悄应用了人工智能技术,通过改进芯片设计提供动力,以提高基本功能如拍照、接听来电等,与其他公司大肆宣传人工智能不同。

Apple-iPhone-15-Pro,苹果

要点:

1. 苹果手表新芯片加入神经网络引擎,提高了语音助手Siri精度。

2. 新款iPhone摄像头可自动识别人像进行模糊背景处理。

3. 双指互点手势可控制苹果手表操作,无需触碰屏幕。

小米:AI声音识别算法性能在国际上排名第一

小米宣布其自研声音识别算法在国际排名中取得第一,该算法在Google发布的音频标记任务中表现最好,并被广泛应用于小米的智能设备中。

微信截图_20230913111342.png

要点:

1. 小米声音识别算法在国际排名中位居第一,在Google音频标记任务取得突破。

2. 该算法广泛应用于小米智能手机、音箱、摄像头等设备,提升了智能化程度。

3. 应用实例包括小米闻声功能、宝宝哭声监测等,为用户提供更人性化的智能体验。

AI获奖名画申请版权被拒!作者624次提示打造

美国一位AI画作的作者Jason Allen为自己的获奖AI画作《太空歌剧院》申请版权被美国版权局拒绝,理由是该画AI含量过高,作者认为创作过程中包含足够人类创造力应该受版权保护。

image.png

要点:

1. Jason Allen为自己的获奖AI画作《太空歌剧院》申请版权,被美国版权局以AI含量过高为由拒绝。

2. Jason Allen认为画作的创作过程包含了他本人的大量创造力投入,不应该因为仅由AI生成就不受版权保护。

3. 这表明AI创作的版权问题在法律模糊地带仍有较大争议,需要进一步讨论界定创作过程中人类创造力的界限。

IBM、Adobe等9家公司加入白宫人工智能安全承诺

最近,Adobe、IBM、Nvidia等9家人工智能公司向白宫承诺开发安全可靠的人工智能,这是拜登政府与人工智能公司达成的第二项此类协议。

AI机器人上班

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. Adobe、IBM、Nvidia等9家公司加入了此前与白宫达成安全承诺的公司行列。

2. 这些公司承诺在商业发布AI系统前进行测试,投资保护模型权重安全,与政府和其他组织分享风险管理信息。

3. 这些都是自愿承诺,反映AI公司与政府加强合作,推动AI的负责任发展。

腾讯大股东Prosus为投资公司开发AI聊天机器人

荷兰电子商务投资公司Prosus为其所投资公司开发了AI聊天机器人PlusOne,以应对越来越多科技企业使用这种新兴技术简化运营。

AI聊天机器人

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. Prosus为投资公司开发AI聊天机器人PlusOne,使用OpenAI软件,作为员工“私人助理”。

2. Prosus是腾讯控股最大股东,持有腾讯约26%股份,计划将持股比例降至24%-25%。

3. 越来越多科技企业开始使用AI聊天机器人等新兴技术来简化运营。

可口可乐利用SD模型创造了最新口味Y3000零糖

可口可乐推出了名为“可口可乐Y3000零糖”的新饮料,据称是与人工智能共同开发的限量版产品,采用了Stable Diffusion等技术进行品牌和包装设计,强调未来和乐观的氛围。

y3000_204x3.png

图片来自Coca‑Cola

要点:

1. 可口可乐开发了一款名为“可口可乐Y3000零糖”的新口味饮料,宣称是与AI共同创作的限量版产品。

2. 通过Stable Diffusion等技术生成包装和品牌视觉设计,营造未来主义的氛围。

3. 饮料将在美国、加拿大、中国等市场上限量发布,与AI合作主要作为噱头和营销手段。

🤖📱💼AI应用

美图秀秀推出“AI滤镜”功能 可快速复制优质滤镜效果

美图秀秀推出“AI滤镜”功能,通过智能学习参考图片的色调和样式,可以帮助用户快速复制和获取心仪的照片滤镜效果。

微信截图_20230913084814.png

要点:

1. AI滤镜可自动学习导入图片的滤镜,复制其效果。

2. 智能推荐参考图片,用户收藏复用。

3. 整个过程简便易操作,无需专业知识。

超赞!Emoji AI可为任何文本生成酷炫emoji表情

EmojiAI.com是一个人工智能emoji建议工具,用户只需输入文字,它就可以根据内容推荐相关emoji,为社交媒体帖子增加趣味性和吸引力。

image.png

体验地址:https://emojiai.com/

要点:

1. EmojiAI.com会根据输入文本的语义、情感等因素推荐相关emoji。

2. 它可以提升自媒体内容和营销文案的趣味性和吸引力。

3. 使用简单,输入文本后直接生成精准的emoji建议。

颠覆性产品!HelpKit AI可将Notion知识库转化为全天候智能助手

HelpKit AI是一款创新的产品,它可以将Notion知识库转化为一个智能的、全天候的AI助手,为您的用户提供准确且即时的回答。这意味着用户无需等待人工客服的回应,而是可以直接通过AI助手获取所需的答案。

image.png

项目地址:https://www.helpkit.so/helpkit-ai

要点:

1. HelpKit AI使用GPT模型,可以针对客户的知识库内容进行训练,实现智能问答等功能。

2. 它可以以弹出窗口或搜索栏的形式嵌入知识库网站,为用户提供人性化交互。

3. 用户只需提问,它就可以在知识库中检索最佳回答。它让客户支持变得更智能、自动化。

智能语音笔记工具AudioNotes 可将语音和无结构文本转化为文本摘要

AudioNotes是一款基于AI的语音笔记应用,可以自动生成结构化文本摘要。主要功能有:录音/上传音频、摘要偏好设置、编辑修改、智能语音转文字等。

image.png

体验地址:https://www.audionotes.app/

要点:

1. 支持录音和上传音频文件自动生成摘要

2. 可自定义摘要语言、文体和长度

3. 提供编辑修改生成的录音转文字和摘要

举报

  • 相关推荐
  • 大家在看
  • Jovu:AI驱动的代码生成,快速实现从想法到生产。

    Jovu是一个AI驱动的代码生成模型,旨在帮助开发者快速构建新服务或扩展现有应用程序。它通过AI技术生成生产就绪的代码,确保一致性、可预测性,并遵循最高标准。Jovu能够加速开发过程,从概念到部署只需几分钟,提供完全可操作的、健壮的后端服务,准备立即上线。它还通过简化开发工作流程、减少时间、优化资源来提高效率和速度。

  • TapScanner:全能扫描仪,AI助力,智能识别与分析。

    TapScanner是一款利用人工智能技术,将移动设备转变为多功能智能扫描仪的应用程序。它能够识别和分析各种对象和文档,提供即时洞察力,并通过扫描轻松提升日常交互。

  • TopicRanker:AI驱动的SERP分析工具,帮助用户发现易于排名的关键词。

    TopicRanker是一款AI驱动的搜索引擎排名分析工具,专注于帮助用户通过分析竞争对手的弱点,发现在搜索引擎结果页面(SERP)中易于排名的关键词。它通过提供详尽的分析报告,AI生成的标题建议,内容大纲,博客文章,以及增强型元描述,帮助用户优化内容创作,提高SEO效果。产品背景信息包括它是由CriminallyProlific.com开发的,并且已经帮助多个企业在谷歌上排名第一。价格方面,TopicRanker提供三种不同的订阅计划,满足不同用户的需求。

  • Warmy:通过AI引擎提高电子邮件的投递率

    Warmy是一个利用人工智能技术来优化电子邮件投递率的平台。它通过分析每个邮箱的发送活动和接收者行为,为每个邮箱制定个性化的预热计划,确保邮件发送量逐渐增加而不会触发垃圾邮件过滤器,从而最大化邮件的投递率。此外,Warmy的Adeline AI引擎能够实时分析发送性能,预测最佳发送时间和频率,帮助用户提高参与度,避免过度发送邮件给接收者造成困扰。Warmy还具备AI驱动的垃圾邮件风险检测功能,能够主动识别并标记具有高垃圾邮件风险的邮件,帮助用户避免邮件落入垃圾邮件文件夹,确保重要邮件能够送达接收者。

  • Glitter AI:将任何流程转化为逐步指南。

    Glitter AI是一个创新的在线工具,它允许用户通过点击和说话来快速创建逐步指南。这项技术简化了教学过程,使得向同事、客户甚至家人传授技能变得简单快捷。

  • Tourly Guide:沉浸式音频导览,让每个地标自己说话

    Tourly Guide是一款移动应用程序,通过使用人工智能技术,为用户提供独特的沉浸式音频导览体验。它允许用户在探索地标时,通过AI生成的音频指南获得深入的了解和教育。该产品的主要优点包括个性化的导览内容、用户友好的界面设计以及对教育和文化探索的重视。Tourly Guide的背景信息显示,它由Roadly, Inc.开发,旨在通过技术提升用户的旅游和学习体验。

  • SaveDay App:随时随地保存、管理和利用内容

    SaveDay是一个智能工具,用于捕捉、组织和利用你的知识。它提供了快速的信息捕捉解决方案,支持保存文章、网站、图片、视频等,并且可以在移动设备上搜索、询问和总结内容。SaveDay注重数据安全和隐私保护,不与第三方共享用户内容。

  • Neurture:通过了解大脑运作制定改变计划的APP

    Neurture是一个旨在帮助用户了解大脑如何运作,并通过基于研究的治疗方法来制定有效的改变计划的应用程序。它通过数字化手写日记条目、获取后续期刊提示建议、由人工智能支持的情景冥想和期刊推荐等功能,帮助用户打破习惯或解决成瘾行为,实现重要的其他目标。Neurture强调隐私和信任,不收集用户数据,不投放广告,不训练模型,旨在为用户提供一个安全、无负担的自我提升环境。

  • AiWatchfulCompanion:革命化的家庭护理方式,从婴儿到老年人。

    AiWatchfulCompanion是一款旨在改变我们照顾亲人方式的应用程序,它通过使用人工智能技术,为远离家乡的护理者提供实时的关怀和支持。该应用利用计算机视觉和音频分析,实时响应亲人的需求,提供连续的安全和健康保障。它还具备紧急响应功能,在无法联系到护理者时,能够向紧急服务提供事故位置。

  • Viva:使用的 Sora 同架构视频生成模型

    Viva 是一个免费的 AI 生成工具和社区,提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能,以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容,使图像和视频更加高质量和 4K。Viva 使 AI 创作更简单、高效。海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。 文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频 目前运动幅度最大的视频生成模型,同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好,同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频,目前很多视频模型的演示都是横屏视频,竖屏的表现并不好,但是短视频又是视频内容的大头,所以竖屏视频的生成质量是个很重要的指标。 但是一致性有一部分测试中保持的不是很好,同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。

  • 大模型之家:提供全面的人工智能大模型产业信息和创新价值研究。

    大模型之家是一个专注于人工智能大模型产业的平台,提供行业报告、技术创新动态、专家评测和奖项荣誉等信息。它通过整合行业资源,推动人工智能技术的创新和应用,帮助企业和个人更好地理解和利用大模型技术。

  • Productboard AI:利用人工智能增强产品团队的决策力和效率

    Productboard AI 是一款集成到产品管理平台中的人工智能工具,它通过分析和理解大量的用户反馈和数据点,帮助产品团队做出更明智的决策,提高工作效率,并加速产品从概念到市场的整个生命周期。它由 OpenAI 提供支持,确保数据安全和隐私保护,同时提供无与伦比的数据组合和针对产品管理工作的微调优化。

  • UserCall:人工智能语音用户访谈代理,深入洞察客户需求。

    UserCall是一款利用人工智能技术进行用户访谈的网站,它通过AI采访员与用户进行一对一的语音通话,从而收集高质量的用户反馈和洞察。这种技术可以大规模地进行用户访谈,提供比传统调查更深入的定性见解,同时节省时间和资源。UserCall的优势在于无需专业用户研究技能,能够自动进行智能跟进提问,帮助企业更好地理解客户需求,改进产品和业务。

  • VideoToPage:将视频或音频内容快速转换成结构化网页摘要的多功能工具。

    VideoToPage是一个高效的在线工具,它能够将视频或音频内容转换成结构化的网页摘要,支持多达96种语言,并具有98.5%的高准确率。用户无需订阅即可使用,特别适合需要将视频内容转换成文字资料、教程、博客文章、标准操作程序(SOP)等多种形式的个人和企业。产品提供快速的转录服务,支持长达5小时的视频,且5分钟以内的文件完全免费。此外,还提供内容的语义层次构建、内容类型定义、语义互连、富文本编辑、多语言理解等功能,使得内容的创建、编辑和发布变得简单快捷。

  • Fiskl:现代AI自动化全球会计解决方案,专为小型企业设计。

    Fiskl是一个多货币的全球会计平台,为小型企业、创业者、开发者和自由职业者提供全面的财务管理工具。它支持170多种货币和21,000多家银行,利用人工智能技术简化银行对账流程,实现零接触Stripe支付和银行对账。Fiskl的主要优点包括实时现金流和财务概览、自动化银行同步、全球支付能力、AI驱动的对账节省高达80%的对账工作量。Fiskl的定价策略包括特别优惠,例如年度订阅可享受50%的循环折扣,并提供30天免费试用期。

  • reap.video:一键将长视频转换为社交媒体短视频的工具。

    reap是一款基于人工智能的视频再利用工具,它能够将长视频内容一键转换成适合社交媒体的短视频。它通过先进的AI分析自动提取视频中最吸引人的片段,生成能够吸引观众的短片。reap支持多种语言,并提供了智能字幕生成、品牌模板定制等功能,帮助内容创作者提高内容的吸引力和可访问性,加速增长和变现。

  • 稀土掘金大模型子站:一站式AI资讯平台,连接开发者与AI技术的最新动态。

    掘金大模型子站是一个专注于AI领域的技术社区平台,提供从基础设施到最终应用的全景图,旨在帮助个人开发者和企业更好地理解和应用大语言模型技术。该平台通过提供资讯、工具和资源,促进AI技术的创新和应用,推动整个AI生态的发展。

  • Cubox:为学习而生的AI阅读器,高效筛选优质内容,提升阅读和学习效率。

    Cubox是一款专业的AI阅读器,旨在通过智能技术帮助用户筛选和整理阅读内容,提升阅读效率和学习效果。它具备自动高亮精彩内容、一键解读网页文章、专业级标注等功能,适用于需要大量阅读和学习的用户。产品背景信息显示,Cubox深受全球专业人士青睐,并且用户阅读的文章总数达到了23,325,802篇,显示了其广泛的用户基础和影响力。

  • InsideAI:实时分析工具,助你洞察竞品用户反馈。

    Inside AI 是一款基于人工智能技术的实时分析工具,它能够帮助用户追踪竞品的用户反馈和市场动态。该工具通过实时网络连接,分析用户评论,依托专有技术,为用户提供可操作的见解。它适用于独立开发者、初创公司、企业、分析师和风险投资公司等,帮助他们节省研究时间,找到正确的产品开发方向。

  • Glato AI:使用人工智能快速生成高质量产品视频

    Glato人工智能是一个通过人工智能技术快速生成高质量产品视频的平台。该产品能够自动生成引人入胜的短视频广告,帮助用户提高投资回报率,并节省创作者招聘等待时间。价格合理,定位于帮助企业提升市场营销效率。

今日大家都在搜的词: