求助: 一段文本的解析,Unicode, UTF8 or...?

时间:2020-12-04 22:39:39
文本如下:

/****************************       Text starts           *************************************/

 HDDW    C O P I E S        P A G E W I D T H      o P A G E L E N G T H      
  C O L O R        D U P L E X        A C C O U N T     j i m m y    D O M A I N     S P C - 8 A 9 A E A 3 2 4 B 0    G R O U P N A M E    D E F A U L T    D E V I C E N A M E    X e r o x 3 2 0 0    L O C A T I O N    $\ \ S P C - 8 A 9 A E A 3 2 4 B 0    P O R T N A M E    U S B 0 0 1    J O B D A T E    Lb P A G E C O U N T        J O B C O S T         D O C U M E N T    jM i c r o s o f t   W o r d   -   _ -N齎;Sf[褃f[b?Sf[陙㏑噀pS鹼邁頞9e鷁畫蔛X[(W顣槝Gl;`. d o c . d o c    J O B S I Z E      6 P O R T T Y P E        I P     S P C - 8 A 9 A E A 3 2 4 B 0    
P O R T    U S B 0 0 1    D R I V E R    6X e r o x   P h a s e r   3 2 0 0 M F P   P C L   6    A U D I T O R _ I D         W K S _ I P    1 9 2 . 1 6 8 . 1 . 1 7 9   

/*******************************       Text ends          ***********************************/

能看出其中的一些英文单词,其中也有中文。(看其中乱码部分,  字符“.doc.doc”前是一段中文。)

求助,看看各路高手有什么意见?
(留下email我可以把原始的此文本的文件发给你。多谢!)。

6 个解决方案

#1


UTF8文件 是以EF BB BF在文件开头的

#2


其它的BOM(byte order mark)

参考下面文章的 Representations of byte order marks by encoding 段:
http://en.wikipedia.org/wiki/Byte_order_mark

#3


该回复于2010-07-28 15:26:44被版主删除

#4


感觉像是16进制的东西

#5


To findcaiyzh, 
文件开头是 00 05 48

#6


我把文件放到我的资源空间了,
大家可以取下来看看:
http://download.csdn.net/source/2444008

走过路过,帮我一下!

#1


UTF8文件 是以EF BB BF在文件开头的

#2


其它的BOM(byte order mark)

参考下面文章的 Representations of byte order marks by encoding 段:
http://en.wikipedia.org/wiki/Byte_order_mark

#3


该回复于2010-07-28 15:26:44被版主删除

#4


感觉像是16进制的东西

#5


To findcaiyzh, 
文件开头是 00 05 48

#6


我把文件放到我的资源空间了,
大家可以取下来看看:
http://download.csdn.net/source/2444008

走过路过,帮我一下!