最新版本 https://podcast-tool-4gp3wuuv7c2e4074-1251562219.tcloudbaseapp.com/
基于云开发 + CloudBase AI ToolKit 构建的播客数据抓取和展示项目
本项目基于 CloudBase AI ToolKit 开发,通过AI提示词和 MCP 协议+云开发,让开发更智能、更高效,支持AI生成全栈代码、一键部署至腾讯云开发(免服务器)、智能日志修复。
后面完整整个流程的开发和上线,其实主要靠cursor和CloudBase,腾讯云自己的codebuddy还是很让人失望的
项目描述
这是一个播客数据抓取和展示工具,主要功能包括:
- 🔍 数据抓取: 自动抓取小宇宙播客平台的播客信息
- 📊 数据展示: 提供播客排行榜和详细信息展示
- ⚡ 实时更新: 通过云函数定时更新播客数据
- 🌐 Web界面: 基于Vue.js的现代化Web界面
项目架构
前端架构
- 框架: Vue 3 + Vite
- UI组件: DaisyUI + Tailwind CSS
- 路由: Vue Router
- 数据解析: PapaParse (CSV解析)
- HTTP请求: Axios
后端架构
- 云函数: Python 3.9 爬虫函数
- 数据存储: CSV文件存储在静态托管
- 定时任务: 云函数触发器
云开发资源
环境信息
- 环境ID:
podcast-tool-4gp3wuuv7c2e4074
- 环境别名:
podcast-tool
- 区域: 上海 (ap-shanghai)
静态网站托管
- 域名:
https://podcast-tool-4gp3wuuv7c2e4074-1251562219.tcloudbaseapp.com
- 访问地址: 播客排行榜
- 数据文件:
podcast_data.csv
(3.8MB, 7202条记录)
云函数
- crawler: Python爬虫函数,负责数据抓取
- crawlPodcasts: Node.js函数,备用爬虫
部署信息
最新部署状态
- ✅ 云函数更新: 2025-07-19 23:33:18
- ✅ 前端部署: 2025-07-19 23:33:35
- ✅ 数据更新: 2025-07-19 23:30:53 (93/100成功)
数据统计
- 总播客数: 7202条
- 本次抓取: 100个URL,成功93个,失败7个
- 数据大小: 3.8MB
控制台管理链接
最开始的原因,手里有一份相对比较齐全的小宇宙节目和声音的数据,我就想复制下中文播客榜,然后再加一个随机推荐的功能。 但基本是零码经验,所以最快的方式是把数据喂给 manus,提下要求,他很快提供了:
基础版本 https://g8h3ilc79ppy.manus.space/
- 可以就是Excel 的前端版本,可以根据主播、简介、名字筛选的网页

进阶版本 https://wazblvhe.manus.space
- 增加了重要的“随机推荐”工能,这大概是一个稍微不同的亮点,最大程度的可以避免因为订阅来带的“马太效应”
- 增加声音随机推荐,可以更高程度上降低选择节目的决策成本
- 提供随机的惊喜感

最终版本 但是在实现最终版本实现上,manus 最终露出了自己愚蠢的样子。 对于最终版本,我主要有三个要求:
- 保留随机推荐和分类榜单的功能
- 可以实现每天自动更新的爬虫程序,与网站自动更新(单独的本地版本爬虫已经实现成功)
- 保留后续可以增加的功能,播客节目文字推荐甚至评分功能
最最关键的是第二个,因为榜单网站最关键的还是要自动更新,以来保证访问量。
在消耗了大约 5000 个积分后,manus 最终还是没有把这个功能集合在腾讯云上,最好能实现的就是把单独的数据和前端托管在自己的服务器上
就是这个 https://podcast-tool-4gp3wuuv7c2e4074-1251562219.tcloudbaseapp.com/
整体上,我对 manus 很失望

继续迭代了一下,目前这个应该是能做到最好的样式了
~~https://podcast-tool-4gp3wuuv7c2e4074-1251562219.tcloudbaseapp.com ~~ 可以推荐你一条还不错的声音,方便你找到那些被历史时间埋没的声音

下午用 manus 快速做了两个查询网页,可以帮助你在小宇宙找到自己可能感兴趣的播客节目
一个是播客随机推荐工具,https://wrpuvkhi.manus.space/
- 可以按照分类查询,按照订阅、节目数量来筛选
- 增加随机推荐播客功能,可以随便给你个节目(不保证质量)
另一个就是个小宇宙播客查询榜单 ,https://g8h3ilc79ppy.manus.space/
- 就是上面功能的一半
当然这里面的数据只是一部分,无法保证更新,这可能类似榜单最大的价值
