C语言字符串截取的几种方法

C的字符串处理和其他高级语言不太一样，它是基于字符数组和指针的，没有内置的字符串类型，所以字符串截取通常需要手动处理，比如使用strncpy或者指针操作。

字符串截取它一般用于解析和提取数据（如日志、配置）、处理用户输入、网络协议处理、安全处理防止缓冲区溢出、文件路径处理等。

下面介绍C语言中字符串截取的几种方法。

方法一：指针直接定位法

char text[] = "server_response_2023";
char *result = text + 16;
printf("年份标识: %s", result);  // 输出2023

通过指针偏移直接访问目标子串的起始位置，例如从字符串 "server_response_2023" 的第16个字符开始，直接通过 text + 16 获取子串 "2023"。此方法无需内存拷贝，性能极高，但要求字符串格式固定且已知截取位置。需注意原字符串的修改可能导致指针失效，且必须确保偏移量不超过字符串实际长度，否则会引发越界访问。

方法二：strncpy标准库函数

char buffer[10];
strncpy(buffer, &text[7], 9);
buffer[9] = '\0';  // 必须显式终止

strncpy函数用于源字符串的前n个字符复制到目标字符串中。

使用 strncpy 函数从源字符串的特定位置复制指定长度的内容到目标缓冲区。例如，从第7个字符开始复制9个字符到 buffer，并手动添加 \0 终止符。此方法适用于需安全截取固定长度内容的场景（如解析协议字段）。需特别注意目标缓冲区大小应至少为 n+1 字节（n为截取长度），否则可能因未终止符导致后续操作异常。

方法三：动态内存分配法

char* dynamic_substr(const char* src, int pos, int len) {
    char* tmp = malloc(len + 1);
    if(!tmp) return NULL;
    
    strncpy(tmp, src + pos, len);
    tmp[len] = 0;
    return tmp;  // 调用者需free
}

通过 malloc 动态分配内存存储子串，避免静态缓冲区大小的限制。例如，函数 dynamic_substr 从源字符串的 pos 位置截取 len 长度的内容，返回新分配的内存指针。调用者需负责调用 free 释放内存，否则会导致内存泄漏。此方法适合处理长度不确定或需要长期保留子串的场景，但需在复杂项目中结合内存池或智能指针管理生命周期。

方法四：循环拷贝法

void manual_copy(char* dest, const char* src, int start, int length) {
    for(int i=0; i<length && src[start+i]; i++) {
        dest[i] = src[start+i];
    }
    dest[length] = '\0';
}

手动逐字符复制实现子串截取，例如通过循环从 src[start+i] 复制到 dest[i]，直到达到指定长度或遇到源字符串结尾。此方法可精确控制拷贝过程，尤其适合处理含嵌入 \0 的二进制数据或需要逐字符校验的场景。循环条件中的 src[start+i] 可自动检测源字符串结尾，避免越界风险，但性能略低于内存操作函数。

方法五：memcpy内存操作（最快）

char quick_buffer[8];
memcpy(quick_buffer, text+15, 4);
quick_buffer[4] = '\0';  // 输出"2023"

利用 memcpy 函数直接复制内存块，例如从字符串第15个位置复制4个字节到 quick_buffer，最后补上终止符 \0。此方法无字符检查开销，性能显著优于 strncpy（实测快2-3倍），适合高频截取操作（如网络协议解析）。但需确保截取长度不超过源字符串有效范围，否则可能复制到无效数据。

开发注意事项

处理多字节字符（如UTF-8）时，需使用宽字符函数如 wcsncpy，避免截断字符导致乱码。所有涉及缓冲区操作的方法均需严格校验长度，例如通过 _STRLEN 宏或 strnlen 防止溢出。若在多线程环境中使用全局缓冲区（如方法二、五），需通过互斥锁（mutex）保护共享资源。此外，动态分配的内存应通过 atexit() 注册释放函数或RAII机制管理，避免内存泄漏。