-
IRIS-RAG-Gen:由 IRIS 矢量搜索提供支持的个性化 ChatGPT RAG 应用程序
iris-rag-gen:一款基于Iris的检索增强生成(RAG)应用 大家好!本文将介绍我的应用iris-rag-gen,这是一款利用iris矢量搜索功能的生成式ai检索增强生成(rag)应用。它结合了streamlit web框架、langchain和openai,能够个性化chatgpt的交互体验,并以iris作为矢量数据库。 核心功能: 文档导入(PDF/TXT): 将PDF或TXT文档导入Iris数据库。 智能问答: 基于已导入文档,与ChatGPT进行交互...
作者:wufei123 日期:2025.01.26 分类:python 13 -
Python 最佳实践:编写简洁且可维护的代码
Python以其简洁性和可读性而闻名,深受初学者和资深开发者的喜爱。然而,编写干净、易于维护的代码需要超越基本语法。本文将探讨一些提升Python代码质量的关键最佳实践。 PEP 8规范的力量 PEP 8是Python的代码风格指南,遵循它能显著提升代码的可读性和可维护性。以下是一些核心原则: # 不良示例 def calculate_total(x,y,z): return x+y+z # 良好示例 def calculate_total(price, tax,...
作者:wufei123 日期:2025.01.26 分类:python 11 -
适用于数据科学的有用 PYTHON 库
本文介绍一系列强大的Python库,助力数据科学家的日常工作。 核心库: NumPy: 数值计算的基石,提供高效的n维数组和矩阵运算,以及线性代数、傅里叶变换等功能。 SciPy: 基于NumPy构建,包含更高级的科学计算模块,涵盖积分、优化、信号处理等领域。 Matplotlib: 数据可视化利器,支持创建各种类型的图表,并可与IPython Notebook无缝集成,甚至整合LaTeX公式。 Pandas: 处理结构化数据的专家,为数据清洗、预处...
作者:wufei123 日期:2025.01.26 分类:python 10 -
新手常见的 Python 面试问题
本文将探讨10个常见的Python面试问题,帮助应届生顺利应对面试。 1. 解释型语言的概念 解释型语言由解释器逐行执行,其动态特性深受开发者青睐,便于调试和开发,并提供即时反馈。 2. Python的主要特性 Python是一款功能强大的跨平台编程语言,支持Windows、macOS和Linux等操作系统。作为解释型语言,它易于调试并提供即时反馈。Python拥有丰富的标准库,广泛应用于数据分析和Web开发(例如NumPy、Pandas、Django等),并支持面向对象编...
作者:wufei123 日期:2025.01.26 分类:python 10 -
了解 OpenAI JSONL 格式:组织记录
早期邮政分拣系统面临的挑战,与如今使用大型语言模型 (LLM) 类似。 如同早期邮局因处理邮件数量不足而导致信件退回,不正确的输入格式也会导致 LLM 微调失败或效果不佳。OpenAI 使用 JSONL (JSON Lines) 格式作为微调数据的标准,确保数据结构化并易于处理。 JSONL 格式的优势 JSONL 格式采用逐行存储,每行一个 JSON 对象。这种格式简洁、易读,并与 OpenAI 的微调 API 兼容。其优势在于: 准确性: 确保模型正确处理数据,...
作者:wufei123 日期:2025.01.26 分类:python 7 -
在 PyTorch 中排列
pytorch 的 torch.arange() 函数详解:创建数值序列张量 本文将详细介绍 PyTorch 中 torch.arange() 函数的功能、参数以及使用方法,并辅以代码示例。torch.arange() 函数用于创建包含指定范围内的数值序列的张量。 函数签名: torch.arange(start=0, end, step=1, *, out=None, dtype=None, layout=None, device=None, requires_grad=...
作者:wufei123 日期:2025.01.26 分类:python 10 -
【Python】B站视频评论和弹幕处理分析脚本
免责声明: 本脚本仅供个人学习和研究使用,禁止用于任何商业或非法用途。 概述 本Python脚本旨在辅助人文学科研究,特别是网络平台话语分析。它能够全面收集和分析B站视频的弹幕和评论数据,尤其适用于对亚文化和社会议题相关的海量内容进行深入研究、分析、补充和总结。 功能与原理 核心功能: 数据采集: 收集视频标题、作者、发布时间、播放量、收藏数、分享数、总弹幕数、评论数、视频描述、分类、视频链接和封面图链接等元数据。 弹幕分析: 提取100条弹幕,并进行情感评分、词性分...
作者:wufei123 日期:2025.01.26 分类:python 11 -
使用 Django 和 HTMX 创建 To-Do 应用程序 - 使用 TDD 添加 Todo 模型部分
this is part two of our series on building a todo application with htmx and django. click here to view part 1. In Part 2, we'll create the todo model and implement its basic functionality via unit testing. Creating the Todo Model In models....
作者:wufei123 日期:2025.01.26 分类:python 11 -
Python 中的排序数据结构
Python 提供多种工具和库来处理排序数据结构,这些结构在保持数据顺序的同时优化搜索、插入和删除操作。本文将介绍以下几种排序数据结构: 堆 (Heap) 排序列表 (Sorted List) 排序字典 (Sorted Dict) 排序集合 (Sorted Set) 堆模块 (heapq) Python 标准库的 heapq 模块提供了高效的堆实现,特别是最小堆。它基于二叉堆,适用于需要频繁访问最小(或最大)元素的场景。 示例: import heapq 堆 = [...
作者:wufei123 日期:2025.01.26 分类:python 7