import pandas as pd
data1 = [ 1 , 2 , 3 , 4 , 5 ]
s = pd. Series( data1)
s
0 1
1 2
2 3
3 4
4 5
dtype: int64
s2 = pd. Series( data1, index = [ 'a' , 'b' , 'd' , 'g' , 'f' ] )
s2
a 1
b 2
d 3
g 4
f 5
dtype: int64
s2[ [ 'a' , 'f' ] ]
a 1
f 5
dtype: int64
dict = {
'name' : [ '张三' , '李四' , '王二' , '赵六' ] ,
'sex' : [ '男' , '男' , '男' , '女' ] ,
'age' : [ 18 , 19 , 20 , 34 ]
}
df = pd. DataFrame( dict )
df
name
sex
age
0
张三
男
18
1
李四
男
19
2
王二
男
20
3
赵六
女
34
df. info( )
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 name 4 non-null object
1 sex 4 non-null object
2 age 4 non-null int64
dtypes: int64(1), object(2)
memory usage: 224.0+ bytes
df. age. astype( 'str' )
0 18
1 19
2 20
3 34
Name: age, dtype: object
df[ 'age' ]
0 18
1 19
2 20
3 34
Name: age, dtype: int64
df. sex
0 男
1 男
2 男
3 女
Name: sex, dtype: object
df. loc[ 1 ]
name 李四
sex 男
age 19
Name: 1, dtype: object
df[ 0 : 2 ]
name
sex
age
0
张三
男
18
1
李四
男
19
df. age = 22
df
name
sex
age
0
张三
男
22
1
李四
男
22
2
王二
男
22
3
赵六
女
22
df[ 'age' ] = [ 12 , 14 , 56 , 34 ]
df
name
sex
age
country
0
张三
男
12
China
1
李四
男
14
China
2
王二
男
56
China
3
赵六
女
34
China
df[ 'country' ] = 'China'
df
name
sex
age
country
0
张三
男
12
China
1
李四
男
14
China
2
王二
男
56
China
3
赵六
女
34
China
df. index
RangeIndex(start=0, stop=4, step=1)
df[ df. age >= 20 ]
name
sex
age
country
2
王二
男
56
China
3
赵六
女
34
China
df[ df. sex == '男' ]
name
sex
age
country
0
张三
男
12
China
1
李四
男
14
China
2
王二
男
56
China
df. sex == '男'
0 True
1 True
2 True
3 False
Name: sex, dtype: bool
df[ ( df. sex == '男' ) & ( df. age< 20 ) ]
name
sex
age
country
0
张三
男
12
China
1
李四
男
14
China
df[ ( df. sex == '女' ) | ( df. age == 56 ) ]
name
sex
age
country
2
王二
男
56
China
3
赵六
女
34
China
df. query( '(age == 12 and sex == "男") or(age == 34 and sex == "女") ' )
name
sex
age
country
0
张三
男
12
China
3
赵六
女
34
China