Android C++开发中的Linux文件IO操作指南

在Android NDK开发中，C++层直接与Linux系统交互，文件IO操作是底层开发的核心技能之一。本文将系统讲解Linux文件IO在Android C++环境中的实现原理、核心函数及优化策略，帮助开发者构建高效、稳定的文件处理逻辑。

一、Linux文件IO基础概念

1.1 系统调用与库函数

Linux文件IO分为两类：

系统调用：open()、read()、write()等直接操作内核的函数
库函数：fopen()、fread()等C标准库封装函数

在Android NDK中，推荐使用系统调用以获得更好的性能控制。例如：

#include <fcntl.h>
#include <unistd.h>
int fd = open("/data/test.txt", O_RDWR | O_CREAT, 0644);
if (fd == -1) {
    // 错误处理
}

1.2 文件描述符管理

每个打开的文件都会分配一个唯一的文件描述符（fd），需注意：

默认限制：每个进程通常有1024个fd限制
Android特殊限制：通过/proc/sys/fs/file-max可查看系统限制
资源释放：必须显式调用close(fd)避免泄漏

二、核心文件IO操作

2.1 文件打开与创建

int open(const char *pathname, int flags, mode_t mode);

关键参数：

flags组合示例：

O_RDONLY    // 只读
O_WRONLY|O_CREAT|O_TRUNC  // 写入并清空
O_RDWR|O_APPEND  // 读写并追加

mode权限：使用stat.h中的宏定义，如S_IRUSR|S_IWUSR

2.2 读写操作实现

基础读写：

char buf[1024];
ssize_t n = read(fd, buf, sizeof(buf));
if (n == -1) {
    // 错误处理
}
ssize_t written = write(fd, buf, n);

高效读写模式：

内存映射：适用于大文件处理

void* addr = mmap(NULL, file_size, PROT_READ|PROT_WRITE, MAP_SHARED, fd, 0);
// 直接操作addr内存
munmap(addr, file_size);

散聚I/O：readv()/writev()实现多缓冲区操作

2.3 文件定位控制

off_t lseek(int fd, off_t offset, int whence);
// whence取值：
// SEEK_SET: 文件开头
// SEEK_CUR: 当前位置
// SEEK_END: 文件末尾

典型应用场景：

随机访问文件
实现文件指针重置

获取文件大小：

off_t size = lseek(fd, 0, SEEK_END);
lseek(fd, 0, SEEK_SET); // 重置指针

三、高级IO模式

3.1 非阻塞IO实现

通过fcntl()设置：

int flags = fcntl(fd, F_GETFL, 0);
fcntl(fd, F_SETFL, flags | O_NONBLOCK);

处理逻辑：

char buf[1024];
ssize_t n = read(fd, buf, sizeof(buf));
if (n == -1 && errno == EAGAIN) {
    // 数据暂不可用
}

3.2 异步IO（AIO）

Android NDK支持libaio库：

#include <libaio.h>
struct iocb cb;
struct iocb* cbs[] = {&cb};
struct io_event events[1];
io_prep_pread(&cb, fd, buf, size, offset);
io_submit(io_ctx, 1, cbs);
// 等待完成
int ret = io_getevents(io_ctx, 1, 1, events, NULL);

3.3 直接IO优化

适用于对性能要求极高的场景：

int fd = open("/data/large.dat", O_DIRECT | O_RDWR);
// 需确保缓冲区对齐（通常512B或4K对齐）

四、性能优化策略

4.1 缓冲区设计

默认缓冲区：系统通常有4K-8K缓冲区

自定义缓冲区：

const size_t BUF_SIZE = 32768; // 32KB
char buf[BUF_SIZE];

双缓冲技术：读写分离缓冲区

4.2 IO调度优化

预读策略：posix_fadvise()提示内核预读

posix_fadvise(fd, 0, 0, POSIX_FADV_SEQUENTIAL);

写入合并：减少系统调用次数

4.3 多线程IO处理

典型架构：

// 生产者线程
void* producer(void* arg) {
    int fd = *(int*)arg;
    while (has_data) {
        write(fd, data, size);
    }
}
// 消费者线程
void* consumer(void* arg) {
    int fd = *(int*)arg;
    char buf[BUF_SIZE];
    while (read(fd, buf, sizeof(buf)) > 0) {
        process_data(buf);
    }
}

五、Android特殊考量

5.1 存储权限管理

动态权限申请：Android 6.0+需运行时请求READ_EXTERNAL_STORAGE/WRITE_EXTERNAL_STORAGE
Scoped Storage：Android 10+限制应用访问外部存储

5.2 性能监控工具

systrace：跟踪文件IO延迟
perfetto：分析系统调用开销
strace：调试IO问题
```
adb shell strace -p <pid> -e trace=file
```

5.3 典型问题解决方案

案例1：EINTR错误处理

ssize_t safe_read(int fd, void* buf, size_t count) {
    ssize_t n;
    do {
        n = read(fd, buf, count);
    } while (n == -1 && errno == EINTR);
    return n;
}

案例2：大文件处理优化

// 使用内存映射处理1GB文件
void process_large_file(const char* path) {
    int fd = open(path, O_RDONLY);
    off_t size = lseek(fd, 0, SEEK_END);
    const size_t chunk_size = 1024*1024*64; // 64MB
    for (off_t offset = 0; offset < size; offset += chunk_size) {
        size_t remaining = size - offset;
        size_t chunk = (remaining > chunk_size) ? chunk_size : remaining;
        void* addr = mmap(NULL, chunk, PROT_READ, MAP_PRIVATE, fd, offset);
        process_chunk(addr, chunk);
        munmap(addr, chunk);
    }
    close(fd);
}

六、最佳实践总结

资源管理：始终检查系统调用返回值，使用RAII模式管理fd
错误处理：区分可恢复错误（EINTR）和致命错误
性能测试：使用/proc/diskstats监控实际IO性能
安全编码：验证所有用户提供的路径，防止目录遍历攻击
版本适配：注意Android不同版本对存储API的变更

通过系统掌握这些Linux文件IO技术，Android C++开发者能够构建出高效、稳定的底层文件处理模块，为应用性能优化奠定坚实基础。实际开发中，建议结合具体场景选择合适的IO模式，并通过性能分析工具持续优化实现。

深入Android C++：Linux文件IO操作全解析