通常用C语言库函数写入的都是ANSI编码格式的文本文件,有时数据处理需要的是 utf-8 格式的文本文件。
先将 字符串 编码转换为UTF-8格式的,然后再写入。
另一种方式可供参考:为 fopen 指定utf-8编码格式,然后写入 wchar_t 字符串,最终写入的文件就是UTF-8编码的了。
附代码1:
#include <stdio.h>
#include <string.h>
#include <Windows.h>
int main()
{
FILE* fp = fopen("original.txt", "wb+");
// 写入UTF-8的BOM文件头
char header[3] = {(char)0xEF, (char)0xBB, (char)0xBF};
fwrite(header, sizeof(char), 3, fp);
char* str = "Hello, 你好!";
int len = strlen(str);
wchar_t *wc = (wchar_t *) malloc (sizeof(wchar_t)*len);
//wchar_t wc[256];
// 将ANSI编码的多字节字符串转换成宽字符字符串
int n = MultiByteToWideChar(CP_ACP, 0, str, len, wc, len);
if ( n > 0 )
{
wc[n] = 0;
char *mb = (char *)malloc(sizeof(char)*len*4);
// char mb[1024];
// 将宽字符字符串转换成UTF-8编码的多字节字符串
n = WideCharToMultiByte(CP_UTF8, 0, wc, wcslen(wc),
mb, len*4, NULL, NULL);
if ( n > 0 )
{
mb[n] = 0;
fwrite(mb, sizeof(char), strlen(mb), fp);
printf("写入成功!");
}
free(mb);
}
free(wc);
fclose(fp);
system("pause");
return 0;
}
附代码2:
#include <stdio.h>
#include <tchar.h>
#include < locale .h>
wchar_t * char2wchar(const char* cchar) ;
int main()
{
FILE* fp = fopen("test.txt", "wt+,ccs=UTF-8");
char *str = "hello, 你好!";
wchar_t* s = char2wchar(str);
fwrite(s, sizeof(wchar_t), wcslen(s), fp);
fclose(fp);
return 0;
}
wchar_t * char2wchar(const char* cchar)
{
wchar_t *m_wchar;
int len = MultiByteToWideChar( CP_ACP ,0,cchar ,strlen( cchar), NULL,0);
m_wchar= new wchar_t[len+1];
MultiByteToWideChar( CP_ACP ,0,cchar,strlen( cchar),m_wchar,len);
m_wchar[len]= '' ;
return m_wchar;
}
-End-