您的位置 首页 java

C|写入UTF-8编码格式的文本文件

通常用C语言库函数写入的都是ANSI编码格式的文本文件,有时数据处理需要的是 utf-8 格式的文本文件。

先将 字符串 编码转换为UTF-8格式的,然后再写入。

另一种方式可供参考:为 fopen 指定utf-8编码格式,然后写入 wchar_t 字符串,最终写入的文件就是UTF-8编码的了。

附代码1:

#include <stdio.h>
#include <string.h>
#include <Windows.h>
 
int main()
{
FILE* fp = fopen("original.txt", "wb+");
 
// 写入UTF-8的BOM文件头
char header[3] = {(char)0xEF, (char)0xBB, (char)0xBF};
fwrite(header, sizeof(char), 3, fp);

char* str = "Hello, 你好!";
int len = strlen(str);
wchar_t *wc = (wchar_t *) malloc (sizeof(wchar_t)*len);
//wchar_t wc[256];
// 将ANSI编码的多字节字符串转换成宽字符字符串
int n = MultiByteToWideChar(CP_ACP, 0, str, len, wc, len);
if ( n > 0 )
{
wc[n] = 0;
char *mb = (char *)malloc(sizeof(char)*len*4);
// char mb[1024];
// 将宽字符字符串转换成UTF-8编码的多字节字符串
n = WideCharToMultiByte(CP_UTF8, 0, wc, wcslen(wc), 
mb, len*4, NULL, NULL);
if ( n > 0 )
{
mb[n] = 0;
fwrite(mb, sizeof(char), strlen(mb), fp);
printf("写入成功!");
}
free(mb);
}
free(wc);
fclose(fp);
system("pause");
return 0;
}
 

附代码2:

#include <stdio.h>
#include <tchar.h>
#include < locale .h>
wchar_t * char2wchar(const char* cchar) ;
int main()
{
FILE* fp = fopen("test.txt", "wt+,ccs=UTF-8");
char *str = "hello, 你好!";
wchar_t* s = char2wchar(str);
fwrite(s, sizeof(wchar_t), wcslen(s), fp);
fclose(fp);
return 0;
}
wchar_t * char2wchar(const char* cchar) 
{ 
wchar_t *m_wchar; 
int len = MultiByteToWideChar( CP_ACP ,0,cchar ,strlen( cchar), NULL,0); 
m_wchar= new wchar_t[len+1]; 
MultiByteToWideChar( CP_ACP ,0,cchar,strlen( cchar),m_wchar,len); 
m_wchar[len]= '' ; 
return m_wchar; 
}
 

-End-

文章来源:智云一二三科技

文章标题:C|写入UTF-8编码格式的文本文件

文章地址:https://www.zhihuclub.com/196705.shtml

关于作者: 智云科技

热门文章

网站地图