作者文章归档:course

Parallels-mac上远程Windows


Parallels官网主要介绍了其在虚拟化、远程应用服务及Mac管理等方面的解决方案,核心内容如下: 1. 产品功能

- **Mac上运行Windows**:Parallels Desktop for Mac能让用户在任何Mac(包括Intel和Apple silicon芯片)上运行Windows系统,实现操作系统间的无缝集成。
- **灵活虚拟化与安全**:提供Citrix替代方案,可简化虚拟应用和桌面管理,支持本地部署、云部署及混合部署模式;保障SaaS和网页浏览安全,适用于远程访问SaaS和企业Web应用场景;提升开发者跨平台生产力,支持多平台访问,便于安全开发和隔离测试;增强Az...

Read more

国家数据局-


该网页为国家数据局相关网站,内容涵盖时政、数据工作动态、政策发布解读、各地进展等多方面,全面展现数据领域发展态势,具体如下:

  1. 时政要闻:聚焦领导人重要活动与高层会议,如习近平出席民营企业座谈会讲话,释放支持民营经济发展信号;李强主持国务院常务会议及专题学习,关注服务贸易等工作;何立峰与美财长视频通话,促进国际经济交流。
  2. 新闻发布:包含数据领域各类会议、政策发布及成果。高质量数据集建设启动,为数据应用打基础;国家数据局举办系列新闻发布会,解读数据价值化、基础设施建设等政策,推动产业发展。
  3. 通知公告:发布数据局业务相关通知,像《全国数据资源统计调查制度》规范数据资源统计;物流数据开放互联试...

Read more

LM Studio-本地设备运行LLM


LM Studio是一款可在本地设备上运行大语言模型(LLMs)的工具,其官网提供了丰富的产品信息,具体如下: 1. 核心功能

- **模型操作**:支持发现、下载和运行本地LLMs,可运行的架构包括Llama、Mistral、Phi等。能从Hugging Face🤗 仓库下载任何兼容的模型文件 ,并通过应用内聊天界面或OpenAI兼容的本地服务器使用模型。
- **多场景应用**:可在笔记本电脑上完全离线运行LLMs;支持与本地文档进行聊天(0.3版本新增功能)。
  1. 使用示例:以C++文件系统实现为例,展示了如何与模型交互。系统提示设定为模拟优秀的C++工程师,先制定解决问题的计划...

Read more

数据工程框架


数据工程框架:数字时代的基石

在数字化浪潮席卷全球的当下,数据已成为驱动企业发展、创新与决策的核心要素。从电商平台精准推送的商品推荐,到金融机构严密的风险评估,再到社交媒体对用户兴趣的深度洞察,数据的身影无处不在。而数据工程框架,作为连接原始数据与实际应用的桥梁,在这场数据驱动的变革中扮演着举足轻重的角色。

简单来说,数据工程框架是一套完整的体系结构和方法论,旨在高效地管理数据的全生命周期,包括数据的采集、存储、处理、分析以及向业务用户或其他系统的交付。它整合了一系列的技术工具、流程和最佳实践,确保数据能够以可靠、安全、可扩展的方式被转化为有价值的信息,进而为企业的战略决策提供坚实支撑。...

Read more

数据工程概述-视频文字


数据工程架构概述

数据工程架构是支撑现代数据驱动应用的核心框架,旨在高效、可靠地管理数据的全生命周期(采集、存储、处理、分析和服务)。它为企业提供从原始数据到业务价值的转化能力,是数据科学、机器学习、商业智能(BI)等上层应用的基础。


1. 核心目标

  • 数据可用性:确保数据可被正确、及时地访问。
  • 可扩展性:支持海量数据的增长(如PB级数据)。
  • 可靠性:保障数据一致性、容错性和灾备能力。
  • 高效性:优化存储与计算的成本及性能。
  • 安全性:通过权限控制、加密等手段保护数据隐私。

2. 典型分层架构

数据工程架构通常分为以下层次:

(1)数据采集层(Ingestion)
  • 功能:从异构数据源...

Read more

DAMA架构概述


一、DAMA:数据管理的基石

在数字化浪潮席卷全球的当下,数据已然成为企业发展的核心驱动力。想象一下,一家电商企业每天都会产生海量的交易数据、用户浏览数据、物流数据等。这些数据如同散落的珍珠,如果没有有效的管理,就无法发挥其应有的价值。通过精准分析用户浏览和购买数据,企业能精准把握用户偏好,从而有针对性地推送商品,大幅提高销售转化率;利用物流数据优化配送路线,降低成本,提升客户满意度。这就是有效数据管理带来的显著效益。

但数据管理并非易事,它面临着诸多复杂的挑战。数据来源广泛且格式多样,既有结构化的数据库数据,也有非结构化的文本、图像、视频数据;数据质量参差不齐,存在缺失值、错误值、重复...

Read more

局部离群因子-LOF


局部离群因子(Local Outlier Factor, LOF)

局部离群因子(LOF)是一种基于密度的异常检测算法,通过比较数据点与其邻居的局部密度差异来识别异常点。核心思想是:若某点的局部密度显著低于其邻居,则可能是异常点。以下是结构化解析:


核心概念

  1. k-距离(k-Distance)
    点 ( p ) 到其第 ( k ) 个最近邻的距离,用于定义该点的邻域范围。

  2. 可达距离(Reachability Distance)
    点 ( p ) 到点 ( o ) 的可达距离定义为:
    [ \text{reach-dist}(p, o) = \max\left...

Read more

咕咕数据-数据提供商


咕咕数据是一家专业的数据提供商,致力于为用户提供专业全面的数据接口以及商业数据分析服务,旨在让数据成为用户的生产原料。

  1. API接口分类:涵盖多个领域,其中金融/基础类接口数量最多,有28个;文字/NLP类有13个;图像/转换类10个;新闻/资讯、条码工具、天气/空气质量类各4个;教育/高考类8个;商业/分析类13个;区域/坐标类5个;网站工具类7个;AI/模型类10个;短信/语音类2个。
  2. 最近新增API接口:包括URL生成网站截图、儿童故事创作大师、诗歌创作AI大师、PDF转HTML、URL转静态HTML文件,每个接口都提供了查看详情的功能。

官网

Read more

算法炼金术:从海量数据到精准洞察的AI实践


AI 数据分析:数字浪潮中的变革力量

在当今这个数字化的时代,数据正以前所未有的速度增长,已然成为驱动各行业发展的核心动力。国际数据公司(IDC)预测,到 2025 年,全球数据总量将激增至 175ZB ,这一数字大得超乎想象,若将这些数据存储在蓝光光盘中,叠起来的高度足以往返月球两次。如此庞大的数据量,犹如一座蕴藏着无尽财富的宝库,然而,传统的数据分析方法在这座宝库面前却显得力不从心。

传统数据分析依赖人工手动处理,不仅效率低下,而且容易出错。想象一下,在面对数百万条销售记录时,人工要逐一核对、计算和分析,不仅耗时费力,还可能因人为疏忽而导致分析结果出现偏差。同时,传统方法对于数据的处...

Read more

AI数据分析-视频文字


AI数据分析:驱动智能时代的决策革命

引言:数据洪流中的智能进化

步入21世纪,数据已然成为与石油相媲美的战略资源。国际数据公司(IDC)预测,到2025年,全球数据总量将激增至175 ZB(1 ZB = 1万亿GB)。然而,令人惊讶的是,其中被有效分析的数据竟不足2%。传统的数据分析方法,由于效率低下,且高度依赖人工经验,在面对海量、复杂且异构的数据时,愈发显得力不从心。

AI数据分析(AI-Driven Data Analytics)适时登场,借助机器学习、深度学习等前沿技术,为数据赋予了“自我学习”的能力,能够从过往的历史规律中精准洞察未来趋势。以Netflix为例,它运用AI深入...

Read more