(原标题:新V不雅国外:谷歌NotebookLM解围ChatGPT花样路子)黑丝 色情
陈沛/文 谷歌的AI条记产物NotebookLM最近新增了经管音频视频文献的功能。随后,这次产物更新得回了前OpenAI创始团队成员Andrej Karpathy温存,以为它给东谈主一种昔日ChatGPT出现的不异感,可能会开启新的AI模子产物花样。
NotebookLM的实践体验更得当科研学习场景
NotebookLM是谷歌实验室(Google Labs)此前仍是推出的AI条记产物。主邀功能是用户上传PDF等才能的文档,或者平直输入谷歌在线文档、在线幻灯片、网页等网址,然后通过AI进行内容总结。用户不错自行发问,让AI针对上传的文档或输入的在线文档内容进行回复。
而这次最新更新是加多了多模态输入功能。用户在以上输入功能的基础上,当今不错上传MP3音频文献,或者平直输入YouTube在线视频的网址。
在输出方面,NotebookLM的主要亮点是不错把输入文档平直输出成两东谈主对话聊天的音频文献,现时仅维持英语音频。此外,NotebookLM还提供了常见的AI内容总结模板,举例提要、学习指南、简报、学问问答等,同期不竭维持用户自行发问。
因此,从我实践使用体验来看,NotebookLM更得当的是科研学习场景。举例学生不错上传上课灌音快速总结学问点、扣问者不错把论文转成听书文献对外宣传、淳厚不错把柄在线教悔视频生成学问点和考题等。
NoteBookLM的多模态新功能其实并非始创
NoteBookLM这次更新的多模态新功能其实并非初度出现。在谷歌实验室的其它产物中仍是出现过YouTube在线视频总结功能,而不久前的Google Illuminate产物也发布过将PDF学术文档转成两东谈主对话音频文献的功能。
很是是在NoteBookLM这次更新多模态功能后不久,新加坡政府科技局(GovTech)的Gabriel Chua很快在HuggingFace上推出了开源版Open NoteBookLM,使用了开源模子Llama 3.1-405B和文本转语音框架MeloTTS,齐全了将PDF转成对话音频文献的中枢功能,而况在生成音频的讲话作风和时长方面提供了更多选项,且能够维持中、英、法、日、韩、意等多种讲话。
99bt尽管在我实践使用开源版Open NoteBookLM的进程中,发现它的生成恶果并莫得谷歌NoteBookLM那么安适,且列队恭候技术长达5至10分钟。但Open NoteBookLM的快速出现至少不错佐证,多模态新功能是很快能被开源界所追上的。
NoteBookLM启示了AI愚弄的新路子
既然在功能层面的创举性不及,那为什么NoteBookLM这次更新还会激勉诸多业界温存,以致与昔日ChatGPT的出现同等看待?这大概是因为NoteBookLM可能会启发AI愚弄的新路子。
自从ChatGPT出现以来,后续精深生成式AI王人以聊天当作主要的产物容貌。久而久之,这种对话问答容貌出现的信息援用开端不准、生成内容“AI味太重”、问答恶果难以核实等问题,也运转影响用户体验。
而NoteBookLM自一运转的定位即是AI条记产物,由用户提供思进一步了解的学问开端,NoteBookLM归来AI助手的变装,以致不需要用户漫无策划地聊天输入,就能准确高效地整理和组织多样容貌的学问内容。
在这种路子下黑丝 色情,AI产物的温存点不仅是为了和用户进行当然对话,而是聚焦对学问层次的组织和整理,以致是不同模态学问的随性调遣,有可能成为新的AI模子产物主流花样。