Anjhon

LLaMAFactory (1)

EasyDataset (1)

有监督微调 (1)

指令微调 (1)

消费主义 (1)

分布式训练 (3)

Transformer (1)

Cursor Free VIP (1)

无限邮箱 (1)

单机多卡 (1)

内存溢出 (1)

定时任务 (1)

Spark部署 (2)

集群部署 (2)

hadoop安装 (1)

flink安装 (1)

zookeeper安装 (1)

人生七年 (1)

机器学习 (9)

推荐系统 (1)

双塔模型 (1)

问题记录 (1)

读书笔记 (6)

纳瓦尔宝典 (1)

大语言模型 (5)

检索增强生成 (2)

文档问答 (1)

娱乐至死 (1)

深度学习 (2)

transformers (2)

如何阅读一本书 (1)

技术精要 (1)

蛤蟆先生去看心理医生 (1)

电子榨菜 (1)

预训练模型 (1)

hugging face (1)

导航地图 (1)

样本不平衡 (1)

特征工程 (2)

数据预处理 (2)

异常检测 (1)

分类算法 (5)

算法大赛 (1)

Python数据处理三板斧 (3)

模型评估 (1)

模型选择 (1)

GitHub Desktop (2)

博客搭建 (1)

随便一说 (2)

stable-diffusion-weiui (1)

Stable Diffusion (1)

模型调用 (1)

阅读插件 (1)

层次分析法 (1)

评分算法 (1)

python-docx (1)

词根词缀 (1)

效率提升 (1)

代码冲突 (1)

豆瓣读书 (1)

豆瓣电影 (1)

项目排期 (1)

岸见一郎 (1)

古贺史健 (1)

斯科特派克 (1)

时序模型 (1)

预测模型 (2)

Holt-Winters (1)

指数平滑 (1)

十大词类 (10)

集成学习 (1)

朴素贝叶斯 (1)

支持向量机 (1)

逻辑回归 (1)

线性回归 (1)

回归算法 (1)

损失函数 (1)

优化函数 (1)

向量矩阵 (1)

虚拟环境 (1)

python基础 (3)

天猫复购预测-挑战赛——Top 0.5%

天猫复购预测-挑战赛——Top 0.5%

根据原数据构建了67个特征，尝试了多种算法和多次参数调优最终得分0.6925，记录过程分享一下。感觉数据指标还可以再优化，调参也还有进步空间，可以进一步优化提升。

朴素贝叶斯 | Naive Bayesian Model

朴素贝叶斯 | Naive Bayesian Model

朴素贝叶斯方法是在贝叶斯算法的基础上进行了相应的简化，即假定给定目标值时属性之间相互条件独立。

K近邻 | K-Nearest Neighbors

K近邻 | K-Nearest Neighbors

K近邻算法，即是给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的K个实例，这K个实例的多数属于某个类，就把该输入实例分类到这个类中。

支持向量机 | Support Vector Machine

支持向量机 | Support Vector Machine

SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。

逻辑回归 | Logistic Regression

逻辑回归 | Logistic Regression

逻辑回归是一种广义的线性回归分析模型，其推导过程与计算方式类似于回归的过程，但实际上主要是用来解决二分类问题（也能处理多分类问题）