Broken Memories

Zero

这是一篇类似杂谈碎碎念的文章, 起源于一次我和 Google Gemini 的无聊聊天记录, 但是看着大模型的回复很有意思于是有了这篇文章.

文章本身并不是什么学术性的非常严谨的去讨论这个学术性的话题: "大模型真的有意识么?". 甚至这篇文章本身都不具备什么专业性质, 有可能这其中很多 AI 的回答相较而言更加专业一点. 以至于我觉得甚至不该将其归类在博客的 code 分类之下.

Zero - 爬虫历史

网络爬虫技术这一项可以说是颇具历史的计算机技术, 从最开始的简单索引工具, 到后来的搜索引擎基础之一, 再到现如今的大模型 (LLM) AI 时代已经历了许许多多的变化. 从曾经大受欢迎的 Scrapy, PySpider 这类的分布式爬虫框架到现在最新 AI 大模型技术的引入, 都让爬虫技术有了不同的发展.

简介

IntellAgent 是一个用于评估和优化对话式 AI 系统的多智能体框架。它通过生成数千个真实、具有挑战性的交互来对智能体进行压力测试，从而发现隐藏的失败点，提升智能体的性能、可靠性和用户体验。

安装

IntellAgent 需要 python >= 3.9

下载项目源码

1
2
git clone [email protected]:plurai-ai/intellagent.git
cd intellagent

安装依赖

1
pip install -r requirements.txt

配置设置

编辑 config/llm_env.yaml 文件设置 LLM 配置

Zero - ApeRAG 简介

ApeRAG 一个号称生产就绪的 GraphRAG 多模态 RAG 引擎。以下是其官网 https://rag.apecloud.com/

目前官方发布了 ApeRAG v0.5.0-alpha.14 版本，其结合了传统向量引擎，全文索引，GraphRAG，视觉索引，摘要索引等多个维度全方面的 RAG 混合检索能力，使用 MinerU 集成作为其增强型的文档处理。在部署方面，官方直接提供了生产级部署的能力：最简可通过 docker 完成基础部署，同时提供了 k8s 部署的实践指导。同时集成了 MCP 服务，提供三方 AI 助手和工具无缝集成访问知识库的能力。

ApeRAG架构分析

2025.10.21 2026.3.6 code 1026 3 分钟

概述

最近踩坑机器学习神经网络中的文本处理,所以有了这篇博客.记录一下基于python word2vec训练中文词向量的方法(英文也同样适用) ~~虽然事后我发现我需要的并不是词向量word2vec,而是训练获得句子向量的方法,权当做个预告吧(咕咕咕)~~
词向量训练:在自然语言处理中将每个单词映射到一个空间向量过程,从而获得每个词汇之间的关联性.(可能说的不太对,大概就这样吧,不是理论帝)

少数正经的图

大模型真的有意识么

Zero

AI时代的爬虫技术

Zero - 爬虫历史

plurai-ai/intellagent 调研

简介

安装

下载项目源码

安装依赖

配置设置

ApeRAG架构分析

Zero - ApeRAG 简介

ApeRAG架构分析

概述