理杏仁-数据提供商-


理杏仁是北京乾谦慧科技有限公司旗下,专注为中小投资者提供专业saas数据服务的平台,以助力投资者更高效地进行投资研究。

  1. 服务宗旨:致力于节省投资人收集、整理和可视化数据的时间,提升研究效率,让用户及时获取关注公司的数据,倡导独立思考、理性投资。
  2. 功能特点
    • 功能丰富:提供准确、详实且快速更新的数据,还有多样的数据图表。具备高效灵活且可自定义的数据筛选器,支持网站数据随意组合制作各类图表,能订阅关注公司指数的各类数据和公告消息。
    • 优势显著:数据算法准确,查询方便快捷,交互专业高效。
  3. 用户评价:获用户好评,称赞其在数据理解、估值分析、界面布局等方面表现出色,解决了其他数据分析软件功能庞杂...

Read more

理杏仁-数据提供商-01001


理杏仁是北京乾谦慧科技有限公司旗下,专注为中小投资者提供专业saas数据服务的平台,以助力投资者更高效地进行投资研究。

  1. 服务宗旨:致力于节省投资人收集、整理和可视化数据的时间,提升研究效率,让用户及时获取关注公司的数据,倡导独立思考、理性投资。
  2. 功能特点
    • 功能丰富:提供准确、详实且快速更新的数据,还有多样的数据图表。具备高效灵活且可自定义的数据筛选器,支持网站数据随意组合制作各类图表,能订阅关注公司指数的各类数据和公告消息。
    • 优势显著:数据算法准确,查询方便快捷,交互专业高效。
  3. 用户评价:获用户好评,称赞其在数据理解、估值分析、界面布局等方面表现出色,解决了其他数据分析软件功能庞杂...

Read more

金融数据采集引擎概述


1. 多源异构金融数据采集引擎概述

1.1 多源异构金融数据采集引擎的定义

多源异构金融数据采集引擎是一种专门用于从多个不同来源和格式中提取、整合金融数据的系统。 随着金融行业的快速发展,数据来源变得越来越多样化,包括金融市场数据、企业财务数据、客户行为数据等。 这些数据可能来自不同的系统、平台或设备,具有不同的数据格式和结构,因此需要一种能够高效处理这些数据的工具。

  • 多源数据:数据可能来自不同的系统,如企业资源计划(ERP)系统、客户关系管理(CRM)系统、金融市场交易平台等。 这些系统各自独立运行,产生的数据来源各不相同。

  • 异构数据:数据格式和结构差异大,可能包括结构化数据(...

Read more

ebook2audiobook-Github


该网页是一个名为ebook2audiobook的GitHub项目页面,主要介绍如何将电子书转换为有声书,支持多种功能和语言,具备详细的使用说明和多种运行方式。 1. 项目概述:旨在将电子书转换为包含章节和元数据的有声书,支持动态AI模型和语音克隆,可处理1107种以上语言,设计可在4GB内存设备上运行,强调仅用于无DRM(数字版权管理)且合法获取的电子书。 2. 功能特点:借助Calibre将电子书转换为文本格式,能按章节拆分,利用Coqui XTTSv2、Fairseq等实现高质量文本转语音,支持自定义语音克隆,提供多种输出格式,可在不同硬件(CPU、GPU、MPS)上运行 。 3. ...

Read more

探秘文本召回模型:信息检索的幕后英雄


探秘文本召回模型:信息检索的幕后英雄

文本召回模型是什么

在信息爆炸的时代,我们每天都会接触到海量的文本数据。无论是在搜索引擎中查找资料,还是在电商平台上寻找心仪的商品,又或是在智能客服系统中获取帮助,我们都希望能够快速、准确地找到与自己需求相关的信息。而文本召回模型,正是在这样的背景下应运而生,成为了信息检索和自然语言处理领域的核心组件。

文本召回模型的核心任务,是在大规模文本库中,根据用户输入的查询(Query),快速找出 Top-K 最相关的文本。这里的大规模文本库,可能包含千万级甚至亿级别的文档,而用户的查询则多种多样,可能是一个简单的关键词,也可能是一个复杂的问题。文本召回模型...

Read more

文本召回模型-视频文字


文本召回模型是信息检索和自然语言处理中的核心组件,主要用于从海量文本中快速筛选出与查询相关的候选集,为后续的排序阶段提供高质量输入。以下是关于文本召回模型的详细解析:


1. 核心概念

  • 核心任务:在大规模文本库(如千万级文档)中,根据用户输入的查询(Query),快速找出Top-K最相关的文本。
  • 特点:强调高效率高召回率,而非精准排序(这是排序模型的任务)。
  • 应用场景
  • 搜索引擎(如网页、商品搜索)
  • 推荐系统(召回相关物品或内容)
  • 问答系统(召回候选答案)
  • 对话系统(召回合适的回复)

2. 常见方法

2.1 传统方法

  • TF-IDF:基于词频统计,计算查询与文档的相似性。
  • BM2...

Read more

大模型RAG实战:RAG原理、应用与系统构建


《大模型RAG实战:RAG原理、应用与系统构建》由汪鹏、谷清水、卞龙鹏所著,全面介绍了RAG(检索增强生成)技术在大模型应用中的原理、实践与优化。随着大模型发展,RAG成为提升性能的关键技术,本书旨在帮助读者掌握RAG技术,构建可靠的RAG系统。

  1. RAG基础

    • RAG概述:RAG是结合大模型与知识检索技术的生成模型,通过检索外部知识提升回答准确性,解决大模型知识更新难、可解释性差等问题,在问答等场景广泛应用。
    • 语言模型基础:介绍Transformer、自动编码器、自回归模型等语言模型原理,如Transformer的词嵌入、编码器、解码器结构,为理解RAG技术提供理论支持。
    • 文本召回模...

Read more

多源异构数据采集引擎-数据采集层-ONE


多源异构数据采集引擎是一种用于从多样化、结构差异大的数据源中高效采集、处理和整合数据的系统。其核心目标是解决数据源的复杂性(如不同协议、格式、存储方式)与数据应用需求(如实时分析、数据湖/仓库构建)之间的矛盾。以下是其关键要素的体系化总结:


1. 核心架构设计

  • 数据源适配层
  • 协议适配:支持HTTP/HTTPS、FTP/SFTP、JDBC/ODBC、MQTT、Kafka等协议。
  • 接口封装:针对API(RESTful、GraphQL)、数据库(SQL、NoSQL)、文件系统(本地/HDFS/S3)等定制连接器。
  • 动态扩展:插件化架构,允许快速集成新数据源(如自定义SDK或模板)。

  • ...

Read more

2025-03-ONE-Tasks-目标与计划


月目标

  • 数据采集引擎架构设计
  • 多维度/多模态自动化数据管道/高并发/高性能
  • 免费接口/数据源聚合层设计

2025-03-03--09 架构设计/V1

2025-03-05

  • 数据源网站-功能编码-录入功能
  • 单数据接口调通-Yahoo yfinance 接口 tushare akshare
  • 预测页面能有数据

2025-03-04

  • 单数据接口调通-Yahoo yfinance 接口 tushare akshare
  • 预测页面能有数据

2025-03-03

  • 采集架构设计
  • 单数据接口调通
  • 预测页面能有数据

Read more

An Agent Framework for Real-Time Financial Information Searching with Large Language Models-论文


金融信息检索的研究,提出了FinSearch这一新型基于代理的搜索框架,旨在解决金融决策中信息检索与分析的难题,通过实验验证了其性能优势。

  1. 研究背景与目的:金融决策需要处理大量实时信息并理解其复杂时间关系。传统搜索引擎和大语言模型(LLMs)在金融信息检索方面各有局限,现有结合两者的尝试也存在不足。研究旨在提出FinSearch框架,解决这些问题。
  2. FinSearch框架设计:由搜索预规划器、带动态查询重写器的搜索执行器、时间加权机制和响应生成器组成。搜索预规划器分解复杂查询,构建搜索图;搜索执行器根据中间结果优化查询;时间加权机制按时间相关性给信息加权;响应生成器整合信息生成报告。
  3. ...

Read more