开启左侧

LangChain支持哔哩哔哩视频总结

[复制链接]
dzmzyqy 发表于 昨天 22:39 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
作者:毛毛的毛毛
是基于LangChain框架下的开发,所以最开始请先
  1. pip install Langchain
  2. pip install bilibili-api-python
复制代码
技术要点:

    使用Langchain框架自带的Document loaders
    修改BiliBiliLoader的源码,自带的并不支持当前b站的视频加载
源码文件修改:
  1. import json
  2. import re
  3. import warnings
  4. from typing import List, Tuple
  5. import requests
  6. from langchain_core.documents import Document
  7. from bilibili_api import sync, video
  8. from langchain_community.document_loaders.base import BaseLoader
  9. # Pre-compile regular expressions for video ID extraction
  10. BV_PATTERN = re.compile(r"BV\w+")
  11. AV_PATTERN = re.compile(r"av[0-9]+")
  12. class BiliBiliLoader(BaseLoader):
  13.     """
  14.     Loader for fetching transcripts from BiliBili videos.
  15.     """
  16.     def __init__(self, video_urls: List[str], sessdata: str, bili_jct: str, buvid3: str):
  17.         """Initialize with bilibili url.
  18.         Args:
  19.              video_urls (List[str]): List of BiliBili v
复制代码
原文地址:https://blog.csdn.net/weixin_41227420/article/details/136238039
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

发布主题
阅读排行更多+

Powered by Discuz! X3.4© 2001-2013 Discuz Team.( 京ICP备17022993号-3 )