Anjhon

LLaMAFactory (1)

EasyDataset (1)

有监督微调 (1)

指令微调 (1)

消费主义 (1)

分布式训练 (3)

Transformer (1)

Cursor Free VIP (1)

无限邮箱 (1)

单机多卡 (1)

内存溢出 (1)

定时任务 (1)

Spark部署 (2)

集群部署 (2)

hadoop安装 (1)

flink安装 (1)

zookeeper安装 (1)

人生七年 (1)

机器学习 (9)

推荐系统 (1)

双塔模型 (1)

问题记录 (1)

读书笔记 (6)

纳瓦尔宝典 (1)

大语言模型 (5)

检索增强生成 (2)

文档问答 (1)

娱乐至死 (1)

深度学习 (2)

transformers (2)

如何阅读一本书 (1)

技术精要 (1)

蛤蟆先生去看心理医生 (1)

电子榨菜 (1)

预训练模型 (1)

hugging face (1)

导航地图 (1)

样本不平衡 (1)

特征工程 (2)

数据预处理 (2)

异常检测 (1)

分类算法 (5)

算法大赛 (1)

Python数据处理三板斧 (3)

模型评估 (1)

模型选择 (1)

GitHub Desktop (2)

博客搭建 (1)

随便一说 (2)

stable-diffusion-weiui (1)

Stable Diffusion (1)

模型调用 (1)

阅读插件 (1)

层次分析法 (1)

评分算法 (1)

python-docx (1)

词根词缀 (1)

效率提升 (1)

代码冲突 (1)

豆瓣读书 (1)

豆瓣电影 (1)

项目排期 (1)

岸见一郎 (1)

古贺史健 (1)

斯科特派克 (1)

时序模型 (1)

预测模型 (2)

Holt-Winters (1)

指数平滑 (1)

十大词类 (10)

集成学习 (1)

朴素贝叶斯 (1)

支持向量机 (1)

逻辑回归 (1)

线性回归 (1)

回归算法 (1)

损失函数 (1)

优化函数 (1)

向量矩阵 (1)

虚拟环境 (1)

python基础 (3)

Spark 开篇

Spark 开篇

Spark 借鉴了 MapReduce 思想发展而来，保留了其分布式并行计算的优点并改进了其明显的缺陷。让中间数据存储在内存中提高了运行速度、并提供丰富的操作数据的API提高了开发速度。Spark可以计算：结构化、半结构化、非结构化等各种类型的数据结构，同时也支持使用Python、Java、Scala、R以及SQL语言去开发应用程序计算数据。Spark 集成了多种大数据工具和框架，如 Kafka、Cassandra、HBase、HDFS 等，形成了一个强大的大数据处理生态系统。Spark 的统一编程模型和强大的性能使其成为大数据分析、实时流处理和机器学习等领域的重要工具。

Linux软件安装实践

Linux软件安装实践

Linux 软件安装实践；记录了 zookeeper、Tomcat、Nginx、Hadoop、SQL、Spark、Flink 等软件的安装和遇到的问题，以供学习和参考；均用 Ubuntu 系统安装。