百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Python:数据的归宿_python数据类型有哪些?

yuyutoo 2025-02-19 14:28 4 浏览 0 评论

"一起学习,一起成长!"

1.文件输入/输出(普通文件)

数据持久化最简单的类型是普通文件,又叫平面文件(flat file)。它仅仅是在一个文件名下的字节流,把数据从一个文件读入内容,然后从内存写入文件。

读写一个文件之前需要打开它:

fileobj=open(filename,mode)

下面是对该open调用的简单解释:

  • fileobj是open()返回的文件对象;
  • filename是该文件的字符串名;
  • mode是指明文件类型和操作的字符串;

mode的第一个字母标明对其的操作

  • r表示读模式。
  • w表示写模式。如果文件不存在则新创建,如果存在则重写新内容。
  • x表示在文件不存在的情况下新创建并写文件。【避免重写文件】
  • a表示如果文件存在,在文件末尾追加写内容。

mode的第二个字母是文件类型

  • t(或省略)代表文本类型;
  • b代表二进制文件。

打开文件之后就可以调用函数来读写数据,最后需要关闭文件。

1.1使用write()写文本文件

函数write()返回写入文件的字节数。

两种写入文件内容的方法:

  • 一是使用函数write(),如下所示

>>>fout=open('relativity','wt')

#函数write返回写入文件的字节数

>>>fout.write(poem)

>>>150

>>>fout.close()

  • 二是使用print(),如下所示

>>>fout=open('relativity','wt')

#打印到指定文件中

>>>print(poem,file=fout)

>>>fout.close()

使用write()还是print()?

print默认会在每个参数后面添加空格,在每行结束处添加换行。为了使print()与write()有同样的输出,传入下面两个参数。

  • sep分隔符:默认是一个空格‘ ’
  • end结束字符:默认是一个换行符‘\n’

除非自定义参数,否则print()会使用默认参数。

>>>fout=open('relativity','wt')

>>>print(poem,file=fout,sep='',end='')

>>>fout.close()

如果@源字符串非常大,可以将数据分块,知道所有字符被写入:

>>>fout=open('relativity','wt')

>>>size=len(poem)

>>>offset=0

>>>chunk=100

>>>while True:

... if offset>size:

... break

... fout.write(poem[offset:offset+chunk])

... offset += chunk

... 100

... 50

...

>>>fout.close()

@如果‘relativity’文件已经存在,使用模式x可以避免重写文件:

>>>fout=open('relativity','xt')

Traceback (most recent call last):

File "", line 1, in

fout=open('relativity','xt')

FileExistsError: [Errno 17] File exists: 'relativity'

针对此种情况,可以加入一个@异常处理

>>>try:

... fout=open('relativity','xt')

... fout.write('stomp stomp stomp')

...except FileExistsError:

... print('relativity already exists!.That was a close one.')

...

relativity already exists!.That was a close one.

1.2使用read()、readline()或者readlines()读文本文件

@read()、readline()最终都返回单个字符串(如poem),readlines()返回单行字符串的列表。

1.2.1 read()

  • 按照字符数读入,read()默认读入文件的所有内容

注意:如果使用不带参数的read()函数一次读入文件的@所有内容,1GB的文件会用到相同大小的内存。

书写格式:poem=fin.read()

@设置最大的读入字符数,限制read()函数一次返回的大小。

代码示例:

>>>poem=''

>>>fin=open('relativity','rt')

>>>chunk=100

>>>while True:

... fragment=fin.read(chunk)

... if not fragment:

... break

... poem += fragment

...

>>>fin.close()

>>>len(poem)

150

读到文件结尾之后,再次调用read()会返回空字符串(’’)。

1.2.2 readline()

l 每次读入文件的一行(通过追加每一行拼接成原来的字符串)

书写格式:line=fin.readline()

代码示例:

>>>poem=''

>>>fin=open('relativity','rt')

>>>while True:

... line=fin.readline()

... if not line:

... break

... poem += line

>>>fin.close()

>>>len(poem)

150

读取文本文件最简单的方式是使用一个迭代器(iterator),它会每次返回一行。

>>>poem=''

>>>fin=open('relativity','rt')

>>>for line in fin:

... poem += line

>>>fin.close()

>>>len(poem)

150

1.2.3 readlines()

  • 读入所有行,并返回单行字符串的列表。

书写格式:lines=fin.readlines()

示例代码:

>>>fin=open('relativity','rt')

>>>lines=fin.readlines()

>>>fin.close()

>>>print(len(lines),'lines read')

5 lines read

>>>for line in lines:

... print(line,end='')

...

There was a young lady named Bright,

Whose speed was far faster than light;

She started one day

In a relative way,

And returned on the previous night.

1.3使用write()写二进制文件

如果文件模式字符串中包含‘b’,那么文件会以二进制模式打开。这种情况下,读写的是字节而不是字符串。

>>> bdata=bytes(range(0,256))

>>> len(bdata)

256

以二进制模式打开文件,并且一次写入所有的数据:

>>> fout=open('bfile','wb')

>>> fout.write(bdata)

256

>>> fout.close()

就像文本一样,二进制数据也可以分块写入,具体可参见文本处。

1.4使用read()读二进制文件

用‘rb打开文件即可:

>>> fin=open('bfile','rb')

>>> bdata=fin.read()

>>> len(bdata)

256

>>> fin.close()

1.5使用with自动关闭文件

Python的上下文管理器(context manager)会清理一些资源,例如打开的文件。它的形式为with expression as variable:

>>> with open('relativity','wt') as fout:

... fout.write(poem)

完成上下文管理器的代码后,文件会被自动关闭。

1.6使用seek()改变位置

无论是读或者写文件,python都会跟踪文件中的位置。函数tell()返回距离文件开始处的字节偏移量。函数seek()允许跳转到文件其他字节偏移量的位置。这意味着可以不用从头读取文件的每一个字节,直接跳到最后位置并只读一个字节也是可行的。

>>> fin=open('bfile','rb')

>>> fin.tell()

0

#使用seek()读取文件结束前最后一个字节:

>>> fin.seek(255)

255

#一直读到文件结束:

>>> bdata=fin.read()

>>> len(bdata)

1

>>> bdata[0]

255

用第二个参数调用函数seek():seek(offset,origin)。

  • 如果origin等于0(默认为0),从开头偏移offset个字节。
  • 如果origin等于1,从当前位置处偏移offset个字节。
  • 如果origin等于2距离最后结尾处偏移offset个字节。

这些值在标准os模块中被定义:

>>> import os

>>> os.SEEK_SET

0

>>> os.SEEK_CUR

1

>>> os.SEEK_END

2

可以用不同的方法读取最后一个字节

>>> fin=open('bfile','rb')

>>> fin.seek(-1,2)

255

>>> fin.tell()

255

>>> bdata=fin.read()

>>> len(bdata)

1

>>> bdata[0]

255

从文件的当前位置寻找的例子

>>> fin=open('bfile','rb')

>>> fin.seek(254,0)

254

>>> fin.tell()

254

>>> fin.seek(1,1)

255

>>> fin.tell()

255

>>> bdata=fin.read()

>>> len(bdata)

1

>>> bdata[0]

255

这些函数对于二进制文件都是极其重要的。当文件是ASCII编码(每个字符一个字节)时,也可以使用它们,但是计算偏移量会是一件麻烦事。其实,这些都取决于文本的编码格式,最流行的编码格式(例如UTF-8)每个字符数都不尽相同。

2.结构化的文本文件

结构化的文本有很多格式,区别它们的方法如下所示:

  • 分隔符,比如tab(‘\t’)、逗号(‘,’)或者竖线(‘|’)。逗号分隔值(CSV)就是这样的例子。
  • ‘<’和‘>’标签,例如XML和HTML。
  • 标点符号,例如JavaScript Object Notation(JSON)。JSON是一种轻量级的数据交换格式,它是基于JavaScript的一个子集。
  • 缩进,例如YAML(即YAML Ain’t Markup Language的缩写)。
  • 混合的,例如各种配置文件。

每一种结构化文件格式都能够被至少一种Python模块读写。

2.1 CSV

带分隔符的文件一般用作数据交换格式或者数据库。最好使用标准的csv模块,因为这样切分会得到更加复杂的信息。

  • 除了逗号,还有其他可代替的分隔符:‘|’和‘\t’很常见。
  • 有些数据会有转义字符序列,如果分隔符出现在一块区域内,则整块都要加上引号或者在她之前加上转义字符。
  • 文件可能有不同的换行符,Unix系统的文件使用’\n’,Microsoft使用’\r\n’,Apple之前使用’\r’而现在使用’\n’。
  • 第一行可以加上列名

2.1.1 csv.writer()

【列表】

首先,读和写一个列表的行,每一行包含很多列:

>>>import csv

>>>villains=[

... ['Doctor','No'],

... ['Rosa','Klebb'],

... ['Mister','Big'],

... ['Auric','Goldfinger'],

... ['Ernst','Blofeld']

... ]

>>>with open('villains','wt') as fout:

... csvout=csv.writer(fout)

... csvout.writerows(villains)

创建文件villains的内容如下:

Doctor,No

Rosa,Klebb

Mister,Big

Auric,Goldfinger

Ernst,Blofeld

2.1.2 csv.reader()

【列表】

重新读villains文件。

>>>import csv

>>>with open('villains','rt') as fin: #一个上下文管理器

... cin=csv.reader(fin)

... villains=[row for row in cin] #使用列表推导式

...

>>>print(villains)

[['Doctor', 'No'], [], ['Rosa', 'Klebb'], [], ['Mister', 'Big'], [], ['Auric', 'Goldfinger'], [], ['Ernst', 'Blofeld'], []]

我们利用函数reader()创建的结构,它在通过for循环提取到的cin对象中构建每一行。

【重要】使用reader()和writer()的默认操作。每一列用逗号分开;每一行用换行符分开。

2.1.3 csv.DictReader()

【字典】

数据可以是以字典为元素的列表(a list of dictionary),不仅仅是以列表为元素的列表(a list of list)。接下来,使用新函数DictReader()读取文件villains,并且制定每一列的名字。

>>>import csv

>>>with open('villains','rt') as fin:

... cin=csv.DictReader(fin,fieldnames=['first','last'])

... villains=[row for row in cin]

...

>>>print(villains)

[OrderedDict([('first', 'Doctor'), ('last', 'No')]), OrderedDict([('first', 'Rosa'), ('last', 'Klebb')]), OrderedDict([('first', 'Mister'), ('last', 'Big')]), OrderedDict([('first', 'Auric'), ('last', 'Goldfinger')]), OrderedDict([('first', 'Ernst'), ('last', 'Blofeld')])]

2.1.4 csv.DictWriter()

【字典】

下面使用新函数DictWriter()重写CSV文件,同时调用writeheader()向CSV文件中第一行写入每一列的名字。

>>>import csv

>>>with open('villains1','wt') as fout:

... cout=csv.DictWriter(fout,['first','last'])

... cout.writeheader()

... cout.writerows(villains1)

>>>villains1

[{'first': 'Doctor', 'last': 'No'},

{'first': 'Rosa', 'last': 'Klebb'},

{'first': 'Mister', 'last': 'Big'},

{'first': 'Auric', 'last': 'Goldfinger'},

{'first': 'Ernst', 'last': 'Blofeld'}]

3.结构化二进制文件

3.1 电子数据表(Excel)

电子数据表,尤其是Microsoft Excel,是广泛使用的二进制数据格式。

如果把电子数据表保存到一个CSV文件中,就可以利用之前提到的标准csv模块读取它。

如果有一个xls文件,也可以使用第三方库xlrd(
http:pypi.python.org/pypi/xlrd)读写文件。

「亲,如果笔记对您有帮助,收藏的同时,记得给点个赞、加个关注哦!感谢!」

「诚邀关注“issnail”,会有惊喜哦!」

「文中代码均亲测过,若有错误之处,欢迎批评指正,一起学习,一起成长!」

参考书目:python语言及其应用

相关推荐

墨尔本一华裔男子与亚裔男子分别失踪数日 警方寻人

中新网5月15日电据澳洲新快网报道,据澳大利亚维州警察局网站消息,22岁的华裔男子邓跃(Yue‘Peter’Deng,音译)失踪已6天,维州警方于当地时间13日发布寻人通告,寻求公众协助寻找邓跃。华...

网络交友须谨慎!美国犹他州一男子因涉嫌杀害女网友被捕

伊森·洪克斯克(图源网络,侵删)据美国广播公司(ABC)25日报道,美国犹他州一名男子于24日因涉嫌谋杀被捕。警方表示,这名男子主动告知警局,称其杀害了一名在网络交友软件上认识的25岁女子。雷顿警...

一课译词:来龙去脉(来龙去脉 的意思解释)

Mountainranges[Photo/SIPA]“来龙去脉”,汉语成语,本指山脉的走势和去向,现比喻一件事的前因后果(causeandeffectofanevent),可以翻译为“i...

高考重要考点:range(range高考用法)

range可以用作动词,也可以用作名词,含义特别多,在阅读理解中出现的频率很高,还经常作为完形填空的选项,而且在作文中使用是非常好的高级词汇。...

C++20 Ranges:现代范围操作(现代c++白皮书)

1.引言:C++20Ranges库简介C++20引入的Ranges库是C++标准库的重要更新,旨在提供更现代化、表达力更强的方式来处理数据序列(范围,range)。Ranges库基于...

学习VBA,报表做到飞 第二章 数组 2.4 Filter函数

第二章数组2.4Filter函数Filter函数功能与autofilter函数类似,它对一个一维数组进行筛选,返回一个从0开始的数组。...

VBA学习笔记:数组:数组相关函数—Split,Join

Split拆分字符串函数,语法Split(expression,字符,Limit,compare),第1参数为必写,后面3个参数都是可选项。Expression为需要拆分的数据,“字符”就是以哪个字...

VBA如何自定义序列,学会这些方法,让你工作更轻松

No.1在Excel中,自定义序列是一种快速填表机制,如何有效地利用这个方法,可以大大增加工作效率。通常在操作工作表的时候,可能会输入一些很有序的序列,如果一一录入就显得十分笨拙。Excel给出了一种...

Excel VBA入门教程1.3 数组基础(vba数组详解)

1.3数组使用数组和对象时,也要声明,这里说下数组的声明:'确定范围的数组,可以存储b-a+1个数,a、b为整数Dim数组名称(aTob)As数据类型Dimarr...

远程网络调试工具百宝箱-MobaXterm

MobaXterm是一个功能强大的远程网络工具百宝箱,它将所有重要的远程网络工具(SSH、Telnet、X11、RDP、VNC、FTP、MOSH、Serial等)和Unix命令(bash、ls、cat...

AREX:携程新一代自动化回归测试工具的设计与实现

一、背景随着携程机票BU业务规模的不断提高,业务系统日趋复杂,各种问题和挑战也随之而来。对于研发测试团队,面临着各种效能困境,包括业务复杂度高、数据构造工作量大、回归测试全量回归、沟通成本高、测试用例...

Windows、Android、IOS、Web自动化工具选择策略

Windows平台中应用UI自动化测试解决方案AutoIT是开源工具,该工具识别windows的标准控件效果不错,但是当它遇到应用中非标准控件定义的UI元素时往往就无能为力了,这个时候选择silkte...

python自动化工具:pywinauto(python快速上手 自动化)

简介Pywinauto是完全由Python构建的一个模块,可以用于自动化Windows上的GUI应用程序。同时,它支持鼠标、键盘操作,在元素控件树较复杂的界面,可以辅助我们完成自动化操作。我在...

时下最火的 Airtest 如何测试手机 APP?

引言Airtest是网易出品的一款基于图像识别的自动化测试工具,主要应用在手机APP和游戏的测试。一旦使用了这个工具进行APP的自动化,你就会发现自动化测试原来是如此简单!!连接手机要进行...

【推荐】7个最强Appium替代工具,移动App自动化测试必备!

在移动应用开发日益火爆的今天,自动化测试成为了确保应用质量和用户体验的关键环节。Appium作为一款广泛应用的移动应用自动化测试工具,为测试人员所熟知。然而,在不同的测试场景和需求下,还有许多其他优...

取消回复欢迎 发表评论: