一.数据类型
1.整数2.浮点数3.字符串4.布尔值:True/False5.空值:None
二.变量
变量名必须是大小写英文、数字和_的组合,且不能以数字开头
三.常量
全部大写的变量名表示常量,python没有一种机制保证常量不能被修改.
PI = 3.14156四.特殊的地板除 //
// 除法只取结果的整数部
如:10 // 3 输出3五.字符串和编码
1.编码的发展:
最开始ASCII(1个字节),存储127个字符(字母和一些符号).遇到中文或其他国家的文字时,出现了乱码,为了解决这个问题,又出现了Unicode编码(2个字节表示一个字符,特殊字符用到4个字节).但因为通常Unicode用2个字节表示一个字符,这导致了它比较占用空间,比如A,这其实可以用一个字节就能表示.于是出现了编码转化为“可变长编码”的UTF-8编码,UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。
在计算机内存中统一用Unicode编码,但需要保存或传输的时候,就转换为utf-8编码.
2.python的字符串是Unicode编码
ord()函数获取字符的整数表示
chr()函数把编码转换为对应的字符print(ord('夏'))print(chr(20013))
输出:
22799中如果知道字符的整数编码,还可以用十六进制这么写
print(hex(ord('中')))print(hex(ord('文')))print('\u4e2d\u6587')
输出:
0x4e2d0x6587中文
3.字节
Python对bytes类型的数据用带b前缀的单引号或双引号表示:
x = b'ABC'bytes中的每个字符只占用一个字节
4.字符和字节的相互转换
(1).字符转字节
以Unicode表示的str通过encode()方法可以编码为指定的bytes,如:
print('ABC'.encode('ascii'))print('中文'.encode('utf-8'))
输出:
b'ABC'b'\xe4\xb8\xad\xe6\x96\x87'(2).字节转字符:
通过字节的decode实现
print(b'ABC'.decode('ascii'))print(b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8'))
输出:
ABC中文5.常用的len函数:
(1).计算字符串长度(2).计算字节长度(3).计算列表/元组等长度
如:
print(len(b'\xe4\xb8\xad\xe6\x96\x87'))print(len(b'abc'))print(len('ok中文'))print(len([0, 1]))
输出:
6342
应当始终坚持使用UTF-8编码对str和bytes进行转换
6.格式化:
(1).% 元组,如
"%s world, my name is %s, age: %d" % ('hello', 'rorshach', 14)
"%s word" % 'hello'常见占位符:
占位符 替换内容%d 整数%f 浮点数%s 字符串%x 十六进制整数(2).format
"{0} world, my name is {1}, age: {2}".format('hello', 'rorshach', 14)
六.判断
python使用and做与运算,使用or做或运算;对于非零数值、非空字符串、非空list等,就判断为True,否则为False
如:
a = [1]if a: print('right')else: print('wrong')
输出:
wrong示例代码:
a = 1b = 2if a == 1 and b ==2: print('a=1,b=2')elif a == 1 or b == 2: print('a=1 or b=2')else: print('no')
七.循环
两种循环:
1.for ... in
如:
for x in range(10): print(x)
2.while:
x = 0while x <= 9: print(x) x += 1
注:python没有++,--等自增/自减运算
3.break:跳出循环
4.continue:忽略本次,继续下一次循环