大模型 Tools(Function Calling)实用性分析 – 以媒体信息解析为例

1次阅读

共计 663 个字符,预计需要花费 2 分钟才能阅读完成。

作为一个喜欢收集影视资源的人,笔者面临的一个任务是:从文件名中解析出格式化的媒体信息(信息源统一为 The Movie Database (TMDB)),方便整理文件,如:

文件名 格式化信息
Young.Woman.and.the.Sea.2024.2160p.DSNP.WEB-DL.H265.HDR.DDP5.1.Atmos-ADWeb.mkv {'title': '泳者之心', 'genre': 'movie', 'year': 2024}
[動畫瘋] 物語系列 第外季&第怪季 [9][1080P].mp4 {'title': '物语系列', 'genre': 'tv(anime)', 'year': 2009, 'tv_season_num': 5, 'tv_episode': 9}

那么,在给定文件名的情况下,怎么用大语言模型(LLM,以下简称大模型)+ TMDB API 来完成媒体信息的解析工作呢?这篇文章应运而生。

当然,解析媒体信息 + 整理媒体文件(或者说媒体文件刮削),已经有很多现成的解决方案,如 nas-toolsjellyfin,笔者更多是想探索大模型的可能性。


“ 太长不看 ” 的总结:

  • qwen-plus-latest (qwen 2.5) 强于 deepseek-chat (v2.5),gpt-4o-mini/gemini-1.5-flash 落后
  • Tools(Function Calling) 在机器间交互不好用,笔者的 JSON 调用模式效率 & 效果更优。

原文链接: 大模型 Tools(Function Calling) 实用性分析 – 以媒体信息解析为例 – OrangeWolf 的博客

正文完
 0