python+openai兼容api实现无向量的pageindex rag检索示例代码

代码语言:python

所属分类:其他

代码描述:python+openai兼容api实现无向量的pageindex rag检索示例代码,无需单独embedding,使用大模型进行推理输出。先分块生成摘要保存,然后大模型上下文查询相关最后提取。

代码标签: python openai 兼容 api 向量 pageindex rag 检索 示例 代码

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

import json
from openai import OpenAI
from typing import List, Dict

class PureAIRAG:
    def __init__(self, api_key: str, base_url: str = "https://dashscope.aliyuncs.com/compatible-mode/v1"):
        # 1. 初始化大模型客户端
        self.client = OpenAI(api_key=api_key, base_url=base_url)
        self.model = "qwen-plus" # 阿里云通义千问模型
        self.document_index = [] # 充当我们的“数据库”

    # ==========================================
    # 阶段一:建库 (切块 -> AI生成摘要/标题 -> 存储)
    # ==========================================
    def build_index(self, raw_text: str):
        print("⏳ 正在切分文档并让 AI 生成摘要与标题...")
        
        # 简单按段落切分 (实际业务中可替换为你需要的策略)
        chunks = [p.strip() for p in raw_text.split('\n\n') if len(p.strip()) > 10]
        
        for i, chunk in enumerate(chunks):
            print(f"  -> 正在处理第 {i}.........完整代码请登录后点击上方下载按钮下载查看

网友评论0