Comment ajouter un BOM UTF-8 en java

j'ai une procédure Java stockée qui récupère l'enregistrement de la table en utilisant L'objet Resultset et crée un fichier csv.

BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION);
retBLOB.open(BLOB.MODE_READWRITE);
OutputStream bOut = retBLOB.setBinaryStream(0L);
ZipOutputStream zipOut = new ZipOutputStream(bOut);
PrintStream out = new PrintStream(zipOut,false,"UTF-8");
out.write('ufeff');
out.flush();
zipOut.putNextEntry(new ZipEntry("filename.csv"));
while (rs.next()){
    out.print(""" + rs.getString(i) + """);
    out.print(",");
}
out.flush();
zipOut.closeEntry();
zipOut.close();
retBLOB.close();
return retBLOB;

Mais le fichier csv généré ne montre pas le bon caractère allemand. La base de données Oracle a aussi une valeur NLS_CHARACTERSET de UTF8.

veuillez suggérer.

15
demandé sur Signal15 2010-12-08 18:10:16

5 réponses

pour écrire un BOM en UTF-8 Vous avez besoin de PrintStream.print() , pas PrintStream.write() .

aussi si vous voulez avoir BOM dans votre fichier csv , je suppose que vous devez imprimer un BOM après putNextEntry() .

8
répondu axtavt 2010-12-08 15:41:35
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(...), StandardCharsets.UTF_8));
out.write('\ufeff');
out.write(...);

cela écrit correctement 0xEF 0xBB 0xBF au fichier, qui est la représentation UTF-8 du BOM.

50
répondu astro 2017-07-05 12:39:39

je pense que out.write('\ufeff'); devrait en fait être out.print('\ufeff'); .

selon la méthode javadoc , la méthode write(int) écrit en fait un octet ... sans encodage de caractères. Ainsi out.write('\ufeff'); écrit le byte 0xff . En revanche, la méthode print(char) encode le caractère comme un ou plusieurs octets en utilisant l'encodage du flux, puis écrit ces octets.

7
répondu Stephen C 2010-12-08 15:42:06

Juste au cas des personnes sont à l'aide PrintStream s, vous avez besoin de faire un peu différemment. Alors qu'un Writer va faire un peu de magie pour convertir un seul octet en 3 octets, un PrintStream nécessite tous les 3 octets du BOM UTF-8 individuellement:

    // Print utf-8 BOM
    PrintStream out = System.out;
    out.write('\ufeef'); // emits 0xef
    out.write('\ufebb'); // emits 0xbb
    out.write('\ufebf'); // emits 0xbf

alternativement, vous pouvez utiliser les valeurs hex pour ceux directement:

    PrintStream out = System.out;
    out.write(0xef); // emits 0xef
    out.write(0xbb); // emits 0xbb
    out.write(0xbf); // emits 0xbf
4
répondu Christopher Schultz 2016-03-30 14:29:54

dans mon cas, il fonctionne avec le code:

PrintWriter out = new PrintWriter(new File(filePath), "UTF-8");
out.write(csvContent);
out.flush();
out.close();
0
répondu Rocio 2013-12-19 09:01:34