首页 > 业界 > 关键词  > 文心大模型4.0最新资讯  > 正文

AI视野:百度开放文心4.0开发权限申请;腾讯混元大模型开放文生图功能;谷歌AI应用禁止生成受限内容;Midjourney新网站上线测试版

2023-10-26 14:58 · 稿源:站长之家

🤖📈💻💡大模型动态

百度开放文心4.0开发权限申请

在2023年百度世界大会上,百度发布了文心大模型4.0,提升了理解、生成、逻辑、记忆等四个方面,现在开发者可以申请使用 ERNIE Bot SDK 开发与接入该模型的应用。

微信截图_20231026083042.png

申请地址:https://aistudio.baidu.com/community/channel/105

【AiBase提要】:

🚀 百度发布文心大模型4.0,大幅提升在理解、生成、逻辑、记忆等方面。

💻 ERNIE Bot SDK开放开发权限,允许开发者使用该模型进行文本创作、通用对话等。

📝 开发者可前往 AI Studio 星河社区官方频道,申请文心大模型4.0的开发权限。

腾讯混元大模型开放文生图功能

腾讯混元宣布开放文生图功能,利用强大的中文理解能力,根据关键词生成具有真实感和自然度的各种风格图片,已被180多个业务接入,将在广告、游戏、内容等领域发挥作用。

【AiBase提要:】

📌 腾讯混元宣布开放文生图功能,可生成多种风格的图片。

📌 这一功能具有强大的中文理解能力,生成的图片具有真实感和自然度。

📌 已被180多个业务接入,将在广告、游戏、内容等领域广泛应用。

🤖📱💼AI应用

阿里国际站推出AI生意助手

阿里巴巴国际站推出了全新的AI工具——生意助手Smart Assistant,旨在通过AI技术提高外贸商家的运营效率、提升转化率和寻找商机。

【AiBase提要:】

🤖 阿里巴巴国际站推出生意助手Smart Assistant,利用AI技术提供外贸商家更优解决方案,包括智能优化商品信息和智能分析市场。

📈 这款工具依托了阿里巴巴国际站的24年外贸实践经验,旨在提高运营效率和帮助商家快速成交。

🌐 阿里巴巴国际站希望通过生意助手推动全球跨境贸易的发展,服务全球外贸商家。

Midjourney新网站上线测试版

Midjourney新网站上线测试版,提供更快、更炫酷的AI绘画体验,包括全新视觉效果、灯光模式、灯箱功能和个人搜索功能。

体验地址:https://beta.midjourney.com/home

【AiBase提要:】

😍 全新网站提升速度和稳定性,改进视觉效果。

💡 新的灯光模式创建逼真场景,增加立体感。

🖼️ 灯箱功能和个人搜索功能让展示和查找作品更便捷。

📰🤖📢AI新鲜事

谷歌发布新规:AI应用禁止生成受限内容

谷歌宣布要求 Android 应用改进对人工智能生成内容的审查,以确保用户可以方便举报冒犯性内容,并限制照片和视频权限。

【AiBase提要:】

📌 谷歌强化 Android 应用监管规定,要求应用提供举报冒犯内容的途径。

📌 Android 应用必须在明年初前添加举报冒犯材料的按钮,以继续在谷歌 Play 商店上运行。

📌 谷歌政策涵盖了多种人工智能生成内容,但不包括总结书籍等用途的应用。

微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全

微软、OpenAI等公司合资1000万美元,任命Chris Meserole为“前沿模型论坛”的执行董事,旨在提高生成式AI产品的安全,并建立AI安全基金支持独立研究。

【AiBase提要】:

🤝 微软、OpenAI等公司联合投资1000万美元,聚焦生成式AI安全。

👨‍💼 Chris Meserole将领导“前沿模型论坛”推动AI安全研究。

💰 成立AI安全基金以支持独立研究,构建安全的AI生态。

亚马逊推出生成式AI助力广告商提升广告创意

亚马逊发布了名为「图像生成」的生成式AI解决方案,帮助广告商轻松创造吸引人的广告创意,提高广告效果。

amazon-blogs-brightspot.s3.amazonaws.jpg

【AiBase提要:】

🛍️ 亚马逊发现广告商在创意构建上遇到挑战,推出生成式AI解决方案。

🖼️ 解决方案可将产品图像嵌入生活场景,提高广告点击率。

🖋️ 广告商可快速创建多个版本的广告创意,提升广告效果。

YouTube Music推出文生图AI功能

YouTube Music在美国启动生成式AI测试,用户可以轻松创建个性化播放列表封面艺术,提供更丰富的音乐体验。

YTM_hero.max-700x3000.format-webp.png

【AiBase提要:】

🎵 用户可以使用生成式AI轻松选择视觉主题,创建独特的播放列表封面艺术。

📊 测试将扩展至更多地区和语言,并可能提供预制建议供用户选择。

📢 YouTube计划在音乐领域引入生成式AI,同时增加其他音乐流媒体功能,如Samples和实时歌词显示。

Google 搜索现在可以帮助验证图像的来源

谷歌推出新工具“关于此图像”,可验证图像来源、提供上下文信息,旨在增强搜索结果的可信度。

【AiBase提要】:

🔍 谷歌推出“关于此图像”工具,帮助验证图像来源和提供上下文信息。

📷 用户可从搜索和 Google 图片结果中使用该功能,了解图像来源和相关背景信息。

🔗 这一举措旨在加强搜索结果的可信度,尤其在涉及新闻和事实核查方面。

IBM发现:ChatGPT非常擅长生成让人点击的钓鱼邮件

IBM研究揭示,ChatGPT能够生成欺骗性强的虚假电子邮件,虽然点击率略低于人工邮件,但制作速度远快于人工,引发担忧。

【AiBase提要:】

🔍 IBM的研究发现,ChatGPT生成的钓鱼邮件几乎具有欺骗性,尽管点击率略低于人工邮件。

🤖 ChatGPT制作虚假电子邮件的速度远快于人工,仅需几分钟。

🌐 随着技术不断进步,人工智能可能有望超越人类在电子邮件欺骗方面的表现。

Meta发布AI模拟环境Habitat3.0

FAIR团队最新推出的Habitat3.0引起了广泛关注,这是一个令人激动的增强型AI模拟环境,旨在训练机器人在真实场景中进行导航。这一创新的推出对于提升AI模拟环境的仿真程度具有重要意义。

image.png

【AiBase提要】

1. Meta发布Habitat3.0,用于教授机器人与物理世界互动。

2. 引入Habitat Synthetic Scenes Dataset,用于训练AI导航代理和HomeRobot。

3. 支持机器人和人形化身协作,拓宽人机合作研究领域。

思科发布Webex新AI战略,增强视频会议功能

思科在年度WebexOne大会上宣布了新AI战略,通过Webex视频会议平台提供自动支持、会议摘要和音视频增强功能,以更好地竞争Zoom、Microsoft Teams和Google Meet等竞争对手。

【AiBase提要:】

1. 💬 Cisco推出Webex新AI策略,包括消息语气修改、建议回复和会议摘要,以改进通信与协作,与竞争对手竞争。

2. 📽️ Webex的新策略整合文本、音频和视频实时智能,解决视频会议中的各种挑战,包括会议摘要功能。

3. 🚀 Cisco引入新的实时媒体模型(RMM)以提升音视频体验,使Webex成为Zoom、Microsoft Teams和Google Meet的有力竞争者。

LexisNexis推出Lexis+ AI 承诺为法律问题提供无幻觉答案

LexisNexis 推出 Lexis+ AI,利用大型语言模型回答法律问题、总结法律问题,生成法律文档草稿。该产品现在对美国客户普遍可用,提供可信赖的法律结果,减少风险,包括对幻觉内容的检查。它具备对话式搜索、文档草拟、总结和文档上传等功能,提供广泛的法律研究材料支持。

【AiBase提要】:

1. LexisNexis 推出 Lexis+ AI,解决法律问题,生成法律文档草稿。

2. 产品现在对美国客户普遍可用,提供可信赖的法律结果,减少风险。

3. 提供对话式搜索、文档草拟、总结和文档上传等功能,包括广泛的法律研究材料支持。

出版商屏蔽AI网络爬虫 Direcqt开发AI聊天机器人

随着出版商阻止AI网络爬虫,Direqt与出版商合作,提供定制聊天机器人解决方案,以提高内容互动和流量。

【AiBase提要】

🤖 Direqt与出版商合作,提供聊天机器人解决方案,应对出版商阻止AI网络爬虫的挑战。

📈 这些聊天机器人平均点击率为24.16%,为出版商带来直接流量和收入分成机会。

💼 Direqt的解决方案为出版商提供了提高参与度和收入的灵活性,适用于广告依赖型公司。

《时代》杂志评选出2023年最佳发明,GPT-4、Dall-E3等入选

《时代》杂志发布了2023年最佳发明榜单,包括200项突破性发明,涵盖了人工智能等领域,其中包括Adobe Photoshop的AI扩展、OpenAI的GPT-4聊天机器人以及其他创新发明。

【AiBase提要:】

1. 《时代》杂志发布了2023年最佳发明榜单,包括涵盖人工智能等领域的200项突破性发明。

2. AI领域入选发明包括Adobe Photoshop的AI扩展和填充功能、OpenAI的GPT-4聊天机器人、Runway Gen-2的电影剪辑工具等。

3. 创新的发明如Alitheon的FeaturePrint假冒商品鉴别技术和Dedrone的无人机探测系统也受到认可。

DataStax集成LangChain 简化生成式AI应用程序的创建

DataStax宣布将LangChain整合到Astra DB中,以便开发者更轻松地创建生成式AI应用程序,促进企业积极参与生成式AI革命。

【AiBase提要:】

🚀 DataStax与LangChain集成,旨在为开发者创建生成式AI应用程序提供便利,促进企业参与。

📊 集成使开发者能够轻松将Astra DB或Apache Cassandra添加为LangChain框架内的新矢量数据源。

🏭 该整合对初创企业和大型企业的开发者都具有重要意义,特别是在构建生成式AI应用程序时。

👨‍💻💡🎯聚焦开发者

DeepSparse:稀疏性技术加速神经网络推理

DeepSparse是一种开源的CPU推理运行时,采用复杂的稀疏性技术,有效提高神经网络推理速度,支持多种模型。

image.png

项目地址:https://github.com/neuralmagic/deepsparse

【AiBase提要】

- 💡 DeepSparse采用稀疏性技术加速神经网络推理,提高性能。

- 💾 最新的DeepSparse LLM支持稀疏内核、8位权重、激活量化,降低内存移动。

- 🚀 DeepSparse已成功集成到TensorFlow中,支持多种计算机视觉和自然语言处理模型。

AgentTuning:通过多智能体任务调整语言模型

研究人员在GitHub上开源的AgentTuning项目提供了一种创新方法,通过多智能体任务的交互轨迹来训练和调整语言模型,以提高效果、泛化能力,减少手动调整工作。

image.png

项目地址:https://github.com/THUDM/AgentTuning

【AiBase提要】

🔍 AgentTuning项目:通过多智能体任务交互来训练语言模型。

📈 提高效果与泛化能力:该方法减少手动调整工作量。

🤖 多领域应用:AgentTuning不仅适用于语言模型,还适用于其他模型类型。

举报

  • 相关推荐
  • 大家在看
  • GPTsWorks:第三方GPTs商店,聊天搜索GPTs。

    GPTs Works 是一个第三方GPTs商店,提供用户通过聊天的方式搜索和发现各种GPTs。该平台汇集了大量优秀的GPTs资源,用户可以通过提交链接或直接与平台交互来获取所需信息。平台的主要优点包括丰富的GPTs资源、便捷的搜索方式以及高效的信息获取能力。

  • ChartFast:AI数据分析师,秒速生成复杂图表。

    ChartFast是一个AI数据分析师工具,旨在简化您的数据可视化和分析任务。它自动化了重复且耗时的数据工作,让您能够快速生成精确而时尚的图表。

  • String Theories:探索和理解弦理论的交互式平台

    String Theories 是一个致力于教育和普及弦理论的交互式网站。它通过可视化工具和模拟,帮助用户理解复杂的物理概念,如弦、膜以及它们在宇宙学中的应用。该平台由物理学家和教育者共同开发,旨在提高公众对现代物理学前沿理论的认识。

  • Studymap.ai:个性化学习计划生成器

    Studymap.ai 是一个利用人工智能技术帮助用户生成个性化学习计划的在线平台。用户可以通过上传YouTube视频链接或文章,平台将基于这些内容生成具有结构化的章节、在线资源和项目想法的完整课程。它还提供进度跟踪功能,帮助用户更有效地学习。

  • ResumaidPro:定制化简历构建工具,AI辅助,提升求职效率。

    ResumaidPro是一款利用人工智能技术帮助求职者快速定制化简历的在线工具。它通过浏览器插件形式,允许用户在浏览器标签页内直接定制简历,优化简历内容以通过自动应聘筛选系统(ATS)。它使得简历定制化变得简单快捷,节省了求职者宝贵的时间,同时提高了求职成功的几率。产品背景是通过利用技术改善简历编写过程,以适应快速变化的就业市场。产品提供了不同套餐,包括按月或按季度计费,并且提供了免费试用。

  • CheckVisaSlots:实时监测美国签证预约空位

    CheckVisaSlots是一个专注于帮助学生和旅行者监测美国签证预约空位的在线服务。它通过提供实时的签证预约信息,帮助用户及时了解签证预约的可用情况,从而更好地规划他们的签证申请流程。该服务特别适合那些需要及时获取签证信息以安排旅行或教育计划的用户。

  • 星界AI:一站式AI图文创作神器

    星界AI是一款集成了多种AI大模型的图文创作神器,包括ChatGPT、谷歌Gemini、百度文心一言等,提供文案创作、知识问答、教育辅导、灵感启发等功能,以提高工作效率和创造力。

  • 神笔AIPPT系统:一键生成海量模板,支持SaaS多开的全开源系统

    神笔AIPPT系统是一款支持一键生成和海量模板的在线建站工具,采用SaaS模式,允许无限多开。该系统基于thinkphp 6.1 + mysql 5.7 + vue3 + vite5技术栈开发,完全开源,支持定制二次开发,适用于需要快速搭建个性化网站的用户。产品原价2888元,提供详细的安装部署文档和参数配置文档,以及使用过程中的免费指导服务。

  • Vozo:AI视频生成器,一键重写和配音视频。

    Vozo是一个AI视频生成器,它允许用户通过AI提示重写视频脚本、自动配音和唇形同步,从而快速生成新的视频内容。它支持将视频翻译成多种语言,并且可以针对不同的受众群体定制视频内容。Vozo的主要优点包括易用性、高效性以及能够保持原有视频的魅力。

  • 扣子专业版:企业级 AI 开发平台,无需编程技能,快速搭建个性化应用。

    扣子专业版是一款企业级 AI 应用开发平台,旨在帮助用户快速、低门槛地构建个性化的 AI 应用,支持无编程技能的用户使用。该平台拥有 1 万 + 插件的丰富生态,能够构建功能强大的大模型应用,同时支持数据私有化及团队协作,适合各类企业需求。定价灵活,能够满足不同规模的企业使用需求,是推动企业数字化转型的重要工具。

  • Gobi:个性化情绪健康指导APP

    Gobi是一款致力于提供个性化情绪健康指导的应用程序。它由一群对AI充满热情的团队开发,团队成员来自Google、Microsoft、Meta和Scale AI等知名公司。Gobi通过实时生成基于科学的语音指导健康实践,帮助用户管理情绪健康。产品的主要优点包括全天候的人性化健康支持、适应性AI个性化、实时健康实践生成、日常检查和情绪健康跟踪等。

  • DiT-MoE:大规模参数扩散变换器模型

    DiT-MoE是一个使用PyTorch实现的扩散变换器模型,能够扩展到160亿参数,与密集网络竞争的同时展现出高度优化的推理能力。它代表了深度学习领域在处理大规模数据集时的前沿技术,具有重要的研究和应用价值。

  • Picogen AI Image API:AI图像生成API,提供高质量的4K图像生成和编辑功能。

    Picogen AI Image API是一个领先的AI图像生成平台,提供与Midjourney, Stable Diffusion和DALL-E相媲美的高质量图像生成服务。它支持生成高达4K分辨率的图像,并且具备图像合并、背景移除和8K分辨率的图像放大等高级功能。Picogen旨在为数字营销人员、平面设计师、内容创作者等专业人士提供强大的视觉内容创作工具。

  • Colocio AI:一站式在线营销工具,由AI驱动,简化广告和内容创作。

    Colocio AI是一款集成了人工智能技术的在线营销工具,旨在帮助用户创建、评估和自动化在线广告活动。它通过AI技术生成高转化率的广告文案和社交媒体内容,提供无障碍的内容调度功能,以及实时的AI辅助和数据驱动的报告,帮助用户优化广告活动,提高性能。Colocio AI的背景是简化内容和媒体创作流程,专注于为品牌和目标受众量身定制内容,同时释放用户时间,让他们专注于战略规划和与受众互动,推动业务创新和增长。

  • Supermemory.ai:你的个人数字第二大脑

    Supermemory是一个致力于帮助用户组织、搜索和利用保存信息的平台。它提供强大的工具,如搜索引擎、写作助手和画布,旨在成为用户的个人第二大脑。它注重隐私保护,可在任何地方工作,支持自托管,并且价格亲民,提供免费层级。

  • Dialed:个性化AI激励演讲,激发潜能。

    Dialed是一款AI驱动的应用程序,旨在通过个性化的激励演讲来激发用户的潜能。无论是健身、演讲还是日常挑战,Dialed都能提供个性化的激励和启发。产品的主要优点包括个性化的激励演讲、真诚的支持、传奇的演讲定制、多种声音选择、背景音乐以及AI生成的激励图像。此外,Dialed还允许用户将激励演讲分享给朋友和家人。

  • Aphrodite-engine:PygmalionAI的大规模推理引擎

    Aphrodite是PygmalionAI的官方后端引擎,旨在为PygmalionAI网站提供推理端点,并允许以极快的速度为大量用户提供Pygmalion模型服务。Aphrodite利用vLLM的分页注意力技术,实现了连续批处理、高效的键值管理、优化的CUDA内核等特性,支持多种量化方案,以提高推理性能。

  • ICSFSurvey:深入研究大型语言模型的内部一致性和自我反馈

    ICSFSurvey是一个关于大型语言模型内部一致性和自我反馈的调查研究。它提供了对LLMs自我评估和自我更新机制的统一视角,包括理论框架、系统分类、评估方法、未来研究方向等。

  • Stable Audio Open demo:从文本提示生成立体声音频

    Stable Audio Open 是一个能够从文本提示生成长达47秒的立体声音频的技术。它包含三个主要组件:一个将波形压缩到可管理序列长度的自编码器、一个基于T5的文本嵌入用于文本条件、以及一个在自编码器的潜在空间中操作的基于变换的扩散(DiT)模型。该技术在生成音频方面表现出色,能够根据文本提示生成各种类型的音频,如打击乐、电子音乐、自然声音等。

  • Claude Engineer:利用Anthropic的Claude模型辅助软件开发任务的高级命令行界面。

    Claude Engineer是一个高级的命令行界面,它利用Anthropic的Claude 3和Claude 3.5模型的能力,来协助完成广泛的软件开发任务。这个工具无缝地结合了最先进大型语言模型的能力与实用的文件系统操作、网页搜索功能、智能代码分析和执行能力。

今日大家都在搜的词: