机器学习相关知识 理解标签和特征的含义 以周志华老师在《机器学习》中判断好瓜的问题为例——给你一个西瓜,如何判断出一个它是不是正熟的好瓜?对于人类来说,根据以前的经验,我们首先会从西瓜这个具体的事物中抽取一些有用的信息,比如西瓜的颜色、瓜蒂的形状、敲击的声音等,然后根据一定的规则在这些信息的基础上进行判断————一般情况下我们认为颜色青绿、根蒂蜷缩…
缺失值观察和处理 查看空值个数 data.info() data.isnull().sum() 缺失值处理 #检索空值 data[data['Age'].isna()] = 0 data[data['Age'].isnull()] = 0 #推荐 data[data['Age'] == None] =…
数据载入及初步观察,探索性分析 载入和观察 相对路径和绝对路径 查看当前工作目录使用os.getcwd(),改变当前工作目录os.chdir(路径),获得当前目录的绝对路径命令os.path.abspath('.')相对路径就是在当前工作目录下的文件,可以直接打开data = pd.read_csv('train.csv')绝对路径就是可以使用任何…
数据分析之MySQL学习 参考课程:戴师兄数据分析 原始幕布格式笔记:戴师兄数据分析启蒙课:SQL基础语法+运行原理+云端数据库搭建.opml,提取码: jb27 基础语法 语法结构:select--from--where--group by--having--order by--limit 运行顺序:from--where--group by--…
一、常用函数 sum函数日期组合date(year(),month(),day()),用来计算环比,同比的日期。日期本质是数字,可以加减操作!sumifs函数,有条件的求和,也可以理解为筛选一些特定字段对应的数值之和!vlookup函数,根据字段匹配相应内容match函数 定位内容所在位置index函数,根据位置提取内容 二、周报表实例操作记录 制…
import pandas as pd data1 = [1,2,3,4,5] s = pd.Series(data1) s 0 1 1 2 2 3 3 4 4 5 dtype: int64 s2 = pd.Series(data1,index = ['a','b','d','g','f']) s2 #自定义索引 a 1 b 2 d 3 g 4 f…
import numpy as np #导入 numpy 包 data1 = [1,2,3,4,5] array1 = np.array(data1) array1 array([1, 2, 3, 4, 5]) data2 = [[1,3,5],[2,4,6]] array2 = np.array(data2) array2 array([[1, …