GPTCrawler | 黑核兵器库

gpt-crawler 是由 BuilderIO 发起的一个开源项目，旨在帮助用户通过爬取网站内容来生成知识文件，从而创建自定义的 GPT。这个工具特别适用于希望基于特定网站内容（例如文档、教程、FAQ等）构建定制化问答系统的场景。

GPTCrawler

简单理解的话，gpt-crawler 就是爬虫 + OpenAI 的结合体，比如你想构建一个擅长解答法律的AI助手，就可以通过 gpt-crawler 爬取法律相关数据，然后上传到OpenAI。

如果我不想上传到OpenAI怎么办？其实你思维可以发散一下，我前面讲到的PrivateGPT恰好就提供了一个API，并且它遵循并扩展了OpenAI API标准，所以你其实可以将 gpt-crawler + PrivateGPT 结合，这样就可以构建一个属于自己的AI助手。

目前 gpt-crawler 支持对单个URL爬取，如果要爬取多个URL，你就必须提供一个 sitemap.xml 的链接，比如 https://builder.io/sitemap.xml

如果你要爬取的网站没有提供 sitemap.xml，或者你想同时爬取多个网站的链接，有两种办法，一是通过 npm run start:server 启动 gpt-crawler 的API服务器，然后通过 /crawl 端点发送 POST 请求来实现；第二需要稍微改动下源码，加个配置，然后在获取下载链接的地方替换成多个URL。

数据评估

GPTCrawler浏览人数已经达到658，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：GPTCrawler的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找GPTCrawler的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站黑核兵器库提供的GPTCrawler都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由黑核兵器库实际控制，在2024年8月5日下午5:22收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，黑核兵器库不承担任何责任。

黑核兵器库致力于优质、实用的网络站点资源收集与分享！本文地址https://zyk.mouzheck.cn/sites/3988.html转载请注明

相关导航

Phot.AI

Phot.ai 是一款在线照片编辑和AI设计工具，为用户提供了全面而便捷的图像创作体验。这款工具不仅具备照片编辑的基本功能，更涵盖了图形设计、专业级修饰以及HDR等高级编辑特性，让用户能够无缝地完成从简单到复杂的图像处理任务。

UIED AI Search

UIED AI Search是一个开源、无广告的AI对话式搜索引擎。它利用人工智能技术来提高搜索的准确性和效率，同时提供一个没有广告干扰的用户体验。

ChatPPT

ChatPPT为必优科技旗下国内AI生成PPT的办公产品，基于AI Chat指令式内容生成与创作，辅助职场办公人工更高效去创作PPT文档，目前接入超过350+指令集，可以在1分钟内完成全篇PPT生成、设计与排版。

悦录

悦录 - 基于AI的下一代智能娱乐办公助手。悦录依托同花顺的语音识别技术，为用户提供免费的录音转文字、语音转文字、视频字幕等服务，1小时音频最快5分钟出稿，准确率高达97%+，全程加密，文件信息安全。解决您在知识学习、工作记录等多种娱乐办公场景下的转文字、造音频、找翻译等多类需求。

牛学长智能抠像工具

牛学长智能抠像工具是一款创新的抠像软件，具有智能抠像、物体移除、人像视频背景抠图等功能，适用于各种复杂场景下的抠像处理。同时，该工具还提供了本地处理功能，保障用户数据的安全性。无论是个人用户还是企业用户，都可以通过这款工具释放创意，提高工作效率和品质。

苏打办公

苏打办公是一个新生代办公效率平台/软件，集合海量办公工具和海量内容模板。核心功能包括PDF阅读、PDF转换、PDF合并拆分、图标识别文字、图片转PDF等，并拥有优质的模板中心，提供PPT模板、Word模板、Excel模板等服务。