站长之家 2 月 7 日讯:企查查APP显示, 2 月 7 日,北京百度网讯科技有限公司申请的“交互方法、模型的训练方法、装置、设备及介质”专利获授权。涉及深度学习、智能搜索、NLP等技术领域。
(举报)
站长之家 2 月 7 日讯:企查查APP显示, 2 月 7 日,北京百度网讯科技有限公司申请的“交互方法、模型的训练方法、装置、设备及介质”专利获授权。涉及深度学习、智能搜索、NLP等技术领域。
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
小米移动软件有限公司最近申请了一项名为“一种拍摄月亮的方法、装置、电子设备及介质”的专利,该专利在近日被公布并获得授权。这项专利的申请日期为2020年7月30日,申请公布日为2022年2月18日,授权公告日为2023年9月22日。这些专利将进一步推动小米公司在手机影像领域的发展,提升用户的拍摄体验。
百度宣布将在10月17日举行“百度世界大会2023”。将在百度世界上“手把手教你做AI原生应用”,也将带来文心一言、搜索、地图、网盘等应用产品的全新亮相。百度世界2023将是一场集合了AI技术和应用的盛会,无论是技术人员、从业者还是AI爱好者,都将在这里获得新的答案。
在昨日的百度世界2023媒体预沟通会上,百度透露了更多的基于大模型重构的最新进展。首先是百度网盘,它正在向个人与企业的知识管理方向发展,推出了基于大模型的网盘智能助理“云一朵”,用户可以通过语音交互操作网盘内的文件、图片、视频等,并且还能帮助用户快速了解视频内容。百度Apollo智舱大模型和智舱开发工具链增强了智能座舱的理解、生成、推理、记忆等核心能力,提升了人车交互方式,使交互体验更加自然,并提升了车内导航、用车等场景的用户体验。
百度发布首个量子领域大模型,及百度量子助手和量子写作助手两大AI原生应用,旨在芯片层、框架层、模型层及应用层等全栈技术上加速量子技术与大模型深度融合,充分激发两大技术各自的潜力。该量子领域大模型是在文心一言基础上,使用量子领域高质量数据进行更有针对性的训练和优化构建的量子领域大模型,能更好地理解量子知识,专业执行量子任务。只需输入6个变量,量子写作助手可在5分钟内撰写一篇13000字符合格式要求的专利文档,高效帮助企业将量子领域的研究成果与知识产权沉淀为企业资产。
百度世界大会 2023 将于 10 月 17 日在北京首钢园举办,百度创始人、董事长兼首席执行官李彦宏将发表长达 1 小时的主题演讲「手把手教你做AI原生应用」,并发布大模型重构后的百度产品。其中,百度「新搜索」也将对外惊艳亮相。10 月 11 日,百度举行百度世界大会 2023 媒体预沟通会。百度集团副总裁、搜索平台负责人肖阳出席并分享了百度搜索在AI原生应用上的进展。他表�
9月19日,百度营销“共拓计划”战略合作正式启动。“共拓计划”是基于百度AIGC技术能力,面向广大服务商与具备此类需求的企业推出的合作伙伴计划。百度渠道生态合作部表示,百度“共拓计划”的推出将开启AIGC营销新纪元,未来百度营销将继续推进AIGC营销规模化应用,与行业生态伙伴一同创造营销无限可能。
9月19日,百度正式发布国内首个“产业级”医疗大模型——灵医大模型。百度正式宣布面向大健康上下游产业开放灵医大模型测评、试用,推动医疗行业的数字化和智能化进程。在辅助诊疗方面,灵医大模型可实现通过多轮对话了解病人病情,实时辅助医生确诊疾病,推荐治疗方案,提升就诊全流程的效率和体验,并成为患者的24小时“健康管家”,提供智能客服服务。
随着9月20日世纪华通旗下盛趣游戏获得传奇系列IP中国大陆完整独占权,明确了该版权在国内的合法授权路径后,包括三九互娱等知名厂商都已迅速寻求合作,即将开展手游等产品的进一步创新。中旭未来、三九互娱、三七互娱还从盛趣取得了第一批小程序游戏的完整正版授权,这也是进入中国23年来传奇系列IP初次正式进军小程序领域。随着IP纠纷的化解和盛趣游戏实现国内市场的“大一统”,传奇系列IP已经迈入新阶段——专业实力的研发伙伴,正规庞大的发行平台,合力一心的维权体系,都将实现这个顶级游戏IP更加长远的发展。
百度世界2023将于10月17日举行,届时将发布大模型重构后的百度产品。在百度世界2023媒体预沟通会上,百度集团副总裁肖阳和王凤阳分享了百度移动生态在AI原生应用上的进展,并透露了一些即将发布的重磅新品。百度营销还将向生态伙伴发起更广范围、更深层次的合作邀请,打通生成式AI在营销领域的应用。
百度宣布百度集团副总裁、CIO李莹博士出任小度科技CEO。李莹于2004年加入百度,在多个核心业务IntegerField上获得丰富经验,任百度CIO期间,她运用AI优化内部流程。小度可望借助百度在AI方面的技术优势,在大模型加持下获得进一步发展。
Spark是一款智能、专注的电子邮件应用,帮助您掌控收件箱。通过智能筛选,快速了解重要内容,并快速清理其余邮件。Spark还提供AI助手帮助您快速编写完美的电子邮件。
Chatbox是一个易于使用的人工智能解决方案,支持多平台,帮助提升工作和学习效率。它具备本地数据存储,确保隐私和轻松访问,同时支持多种尖端人工智能模型,提供多样化、适应性和智能化的用户互动。Chatbox还具备强大的提示功能,释放创造力,支持Markdown、引用、令牌估计等功能,为思维提供广阔的发展空间。
ChatX是一个基于先进AI技术的客户端应用,它通过高速API服务器提供极速体验,支持iPhone、iPad和macOS设备间的云同步。用户可以利用它完成各种AI任务,如文本生成、图片生成等,显著提高工作效率。产品的主要优点包括高速访问、自定义功能、经济的按字数消耗模式以及丰富的高级功能,如AI参数微调、Siri朗读等。ChatX的背景是AI技术的快速发展和用户对于高效、智能工具的需求。目前,产品在Mac App Store上免费提供,但提供App内购买项目。
RAGFlow是一个开源的RAG(Retrieval-Augmented Generation)引擎,基于深度文档理解,提供流线型的RAG工作流程,适用于各种规模的企业。它结合了大型语言模型(LLM)提供真实的问答能力,支持从各种复杂格式数据中引用确凿的引文。
EmojiTell是一个创新的在线服务,可以将文本翻译成表情组合,增加沟通的趣味性和表现力。它由一支对表情符号充满热情的开发者和设计师团队开发,旨在通过表情符号的力量,让信息传递更加生动和个性化。
Perplexica是一个开源的AI驱动搜索引擎,它不仅搜索网络,还理解您的问题。它使用先进的机器学习算法,如相似性搜索和嵌入,来优化结果,并提供引用来源的清晰答案。使用SearxNG保持最新和完全开源,确保您始终获得最新信息,同时不损害您的隐私。
FaceChain是一个深度学习工具链,由ModelScope提供支持,能够通过至少1张肖像照片生成你的数字孪生体,并在不同设置中生成个人肖像(支持多种风格)。用户可以通过FaceChain的Python脚本、熟悉的Gradio界面或sd webui来训练数字孪生模型并生成照片。FaceChain的主要优点包括其生成个性化肖像的能力,支持多种风格,以及易于使用的界面。
HuggingFace镜像站是一个非盈利性项目,旨在为国内的AI开发者提供一个快速且稳定的模型和数据集下载平台。通过优化下载过程,减少因网络问题导致的中断,它极大地提高了开发者的工作效率。该镜像站支持多种下载方式,包括网页直接下载、使用官方命令行工具huggingface-cli、本站开发的hfd下载工具以及通过设置环境变量来实现非侵入式下载。
WebLlama是一个基于Meta Llama 3构建的代理,专门为网页导航和对话进行了微调。它旨在构建有效的以人为中心的代理,帮助用户浏览网页,而不是取代用户。该模型在WebLINX基准测试中超越了GPT-4V(零样本)18%,展示了其在网页导航任务中的卓越性能。
GitHub Copilot for Infrastructure as Code(简称Infra Copilot)是一个利用机器学习技术帮助基础设施专业人员自动生成精确基础设施代码的工具。它通过理解基础设施任务的上下文,允许专业人员使用自然语言表达需求,并接收相应的代码建议。Infra Copilot不仅简化了基础设施即代码(IaC)的开发过程,还确保了跨环境和项目的一致性,加速了新团队成员的上手和学习过程,显著提高了工作效率并节约了时间。
LLaVA++是一个开源项目,旨在通过集成Phi-3和LLaMA-3模型来扩展LLaVA模型的视觉能力。该项目由Mohamed bin Zayed University of AI (MBZUAI)的研究人员开发,通过结合最新的大型语言模型,增强了模型在遵循指令和学术任务导向数据集上的表现。
PhysDreamer是一个基于物理的方法,它通过利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。这种方法允许在缺乏真实物体物理属性数据的情况下,模拟出对新颖交互(如外力或代理操作)的真实反应。PhysDreamer通过用户研究评估合成交互的真实性,推动了更吸引人和真实的虚拟体验的发展。
AI快站是一个为AI开发者设计的服务平台,提供HuggingFace模型的免费加速下载,解决大模型下载缓慢和断开的问题,支持高达4M/s的下载速度,大幅减少等待时间,提高开发效率。
Llama-3 8B Instruct 262k是一款由Gradient AI团队开发的文本生成模型,它扩展了LLama-3 8B的上下文长度至超过160K,展示了SOTA(State of the Art)大型语言模型在学习长文本操作时的潜力。该模型通过适当的调整RoPE theta参数,并结合NTK-aware插值和数据驱动的优化技术,实现了在长文本上的高效学习。此外,它还基于EasyContext Blockwise RingAttention库构建,以支持在高性能硬件上的可扩展和高效训练。
CoreNet 是一个深度神经网络工具包,使研究人员和工程师能够训练标准和新颖的小型和大型规模模型,用于各种任务,包括基础模型(例如 CLIP 和 LLM)、对象分类、对象检测和语义分割。
Llama中文社区是一个专注于Llama模型在中文方面的优化和上层建设的技术社区。社区提供基于大规模中文数据的预训练模型,并对Llama2和Llama3模型进行持续的中文能力迭代升级。社区拥有高级工程师团队支持,丰富的社区活动,以及开放共享的合作环境,旨在推动中文自然语言处理技术的发展。
Interactive3D是一个先进的3D生成模型,它通过交互式设计为用户提供了精确的控制能力。该模型采用两阶段级联结构,利用不同的3D表示方法,允许用户在生成过程的任何中间步骤进行修改和引导。它的重要性在于能够实现用户对3D模型生成过程的精细控制,从而创造出满足特定需求的高质量3D模型。
GraphRAG (Graphs + Retrieval Augmented Generation) 是一种通过结合文本提取、网络分析以及大型语言模型(LLM)的提示和总结,来丰富理解文本数据集的技术。该技术即将在GitHub上开源,是微软研究项目的一部分,旨在通过先进的算法提升文本数据的处理和分析能力。
Qwen1.5-110B是Qwen1.5系列中规模最大的模型,拥有1100亿参数,支持多语言,采用高效的Transformer解码器架构,并包含分组查询注意力(GQA),在模型推理时更加高效。它在基础能力评估中与Meta-Llama3-70B相媲美,在Chat评估中表现出色,包括MT-Bench和AlpacaEval 2.0。该模型的发布展示了在模型规模扩展方面的巨大潜力,并且预示着未来通过扩展数据和模型规模,可以获得更大的性能提升。
ID-Aligner 是一种用于增强身份保留文本到图像生成的反馈学习框架,它通过奖励反馈学习来解决身份特征保持、生成图像的审美吸引力以及与LoRA和Adapter方法的兼容性问题。该方法利用面部检测和识别模型的反馈来提高生成的身份保留,并通过人类标注偏好数据和自动构建的反馈来提供审美调整信号。ID-Aligner 适用于LoRA和Adapter模型,通过广泛的实验验证了其有效性。