Java对比学习Python之高级特性:IO编程
IO还是挺复杂的,有I/O模型可以分为:阻塞I/O模型、非阻塞I/O模型、I/O复用模型、信号驱动式I/O模型和异步I/O模型。
我们来系统对比一下 Java 和 Python 的 I/O 编程(输入输出),包括文件读写、标准输入输出、网络 I/O、缓冲与流式操作等方面,帮助你从 Java 背景快速掌握 Python 的 I/O 编程,当然也可以从Python背景快速掌握Java的I/O编程。
一、整体对比:I/O 编程设计理念
特性 | Java | Python |
I/O 类/模块 | java.io / java.nio | 内置 open() / 模块:io、os、shutil |
面向对象程度 | 高:使用类封装各种流对象 | 较轻量,更多是函数式风格 |
编码处理 | 明确指定编码(InputStreamReader) | 内置 open() 支持 encoding 参数 |
异常处理 | 必须捕获 IOException 等 | 可选捕获(动态类型 + EAFP 原则) |
文件操作简洁度 | 繁琐(需要多个类组合) | 简洁(内置函数 + with 上下文管理) |
网络 I/O | Socket,支持同步/非阻塞(NIO) | socket模块,支持同步/协程式异步 |
二、文件读写对比
1. 打开文件(open)
Java:
BufferedReader reader = new BufferedReader(new FileReader("test.txt"));
Python:
# 打开test.txt文件,只读模式,编码指定utf-8
f = open("test.txt", "r", encoding="utf-8")
2. 读文件内容
Java:
String line;
while ((line = reader.readLine()) != null) {
System.out.println(line);
}
reader.close();
// java也有自动关闭流的写法,把try(BufferedReader reader = new BufferedReader(new FileReader("test.txt"))){...
Python:
# 读取 然后不用关闭流会自动关闭文件。
with open("test.txt", "r", encoding="utf-8") as f:
for line in f:
print(line.strip())
Python 推荐使用 with,自动关闭文件(上下文管理)
3. 写文件内容
Java:
BufferedWriter writer = new BufferedWriter(new FileWriter("out.txt"));
writer.write("Hello Java");
writer.newLine();
writer.close();
Python:
with open("out.txt", "w", encoding="utf-8") as f:
f.write("Hello Python\n")
4. 读取全部内容 vs 行列表
操作 | Python 示例 |
读取全部内容 | f.read() |
读取一行 | f.readline() |
读取所有行 | f.readlines() 返回列表 |
三、二进制读写(bytes)
Java:
FileInputStream fis = new FileInputStream("a.jpg");
byte[] buffer = new byte[1024];
int len = fis.read(buffer);
Python:
with open("a.jpg", "rb") as f:
data = f.read()
Python 使用 'rb' / 'wb' 模式读写二进制文件,返回/写入的是 bytes 类型。
四、标准输入输出(stdin/stdout)
Java:
Scanner sc = new Scanner(System.in);
String line = sc.nextLine();
System.out.println(line);
Python:
line = input()
print(line)
五、文件与目录操作
Python 中常用:
import os
os.path.exists("file.txt")
os.mkdir("dir")
os.remove("file.txt")
os.rename("old.txt", "new.txt")
Java 则使用 File 或 Files 类:
File f = new File("file.txt");
boolean exists = f.exists();
f.renameTo(new File("new.txt"));
比较一下文件和目录操作的API:
功能 | Java 示例 | Python 示例 |
检查文件是否存在 | new File("a.txt").exists() | os.path.exists("a.txt") |
创建文件夹 | new File("dir").mkdir() | os.mkdir("dir") 或 os.makedirs() |
删除文件 | new File("a.txt").delete() | os.remove("a.txt") |
删除目录 | new File("dir").delete() | os.rmdir("dir") |
遍历目录 | listFiles() | os.listdir("dir") |
获取文件大小 | file.length() | os.path.getsize("a.txt") |
拼接路径 | Paths.get("a", "b", "c") | os.path.join("a", "b", "c") |
获取绝对路径 | file.getAbsolutePath() | os.path.abspath("a.txt") |
六、网络 I/O(简要)
网络I/O是比较复杂的,后面再专门对比。
Java:
ServerSocket server = new ServerSocket(8000);
Socket socket = server.accept();
BufferedReader in = new BufferedReader(new InputStreamReader(socket.getInputStream()));
Python:
import socket
s = socket.socket()
s.bind(('localhost', 8000))
s.listen()
conn, addr = s.accept()
data = conn.recv(1024)
Python 的 asyncio 或第三方 aiohttp 支持协程式异步 I/O。
七、对象序列化对比:Java vs Python
特性 | Java | Python |
序列化模块 | java.io.Serializable + ObjectOutputStream | pickle(二进制) / json(文本) |
序列化成文件 | writeObject(obj) | pickle.dump(obj, file) / json.dump() |
反序列化 | readObject() | pickle.load(file) / json.load() |
自定义序列化 | readObject()/writeObject() 方法重写 | default() 参数 + __dict__ 属性 |
跨平台性 | Java 的序列化受 JVM 限制 | json 通常跨语言,pickle 仅限 Python |
Java 序列化示例
class Person implements Serializable {
String name;
int age;
}
ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("person.ser"));
oos.writeObject(new Person("Tom", 20));
oos.close();
//虽然这种方式是jdk提供的,不过一般用的少,可用protobuf或者jsonObject来做序列化。
Python pickle 示例
import pickle
class Person:
def __init__(self, name, age):
self.name = name
self.age = age
# 序列化
p = Person("Tom", 20)
with open("person.pkl", "wb") as f:
pickle.dump(p, f)
# 反序列化
with open("person.pkl", "rb") as f:
new_p = pickle.load(f)
print(new_p.name, new_p.age)
Python json 示例(跨平台更好)
import json
person = {"name": "Tom", "age": 20}
# 写入 JSON 文件
with open("person.json", "w", encoding="utf-8") as f:
json.dump(person, f)
# 读取 JSON 文件
with open("person.json", "r", encoding="utf-8") as f:
data = json.load(f)
print(data["name"], data["age"])
注意:json 只能处理基础类型(dict, list, str, int, float, bool, None)
都看到这里了,不妨点个关注,后面会分享大模型应用开发相关的哦。