Portál AbcLinuxu, 12. května 2025 04:26
#!/usr/bin/perl -w use strict; use DBI; my $new_handle = DBI->connect("dbi:Pg:dbname=rtdb",'rtuser','****'); $new_handle->{pg_enable_utf8}=1; $new_handle->do("SET client_encoding TO 'UTF8'"); my $old_handle = DBI->connect("dbi:mysql:dbname=rtdb",'rtuser','****'); $old_handle->do("SET NAMES 'utf8'"); $old_handle->do("SET CHARACTER SET 'utf8'"); my @tables = qw/Attachments/; foreach my $table (@tables) { print "Migrating $table...\n"; # Find all the rows in the table my $sth = $old_handle->prepare("SELECT * FROM $table") || die $@; $sth->execute || die $@; copy_table_rows($table, $sth); } sub copy_table_rows { my $table = shift; my $sth = shift; while (my $row = $sth->fetchrow_hashref) { my @keys; my @values; my @placeholders; foreach my $key (keys %$row) { push @keys, $key; push @values, $row->{$key}; push @placeholders, '?'; } my $insert = "INSERT into $table (".join(',',@keys).") VALUES (".join(',',@placeholders).")\n"; my $sth= $new_handle->prepare($insert) || die $@; $sth->execute(@values) || die $@ . "\n ".join(",",@values); } } $old_handle->disconnect(); $new_handle->disconnect();Ten skončí s chybou:
DBD::Pg::st execute failed: ERROR: invalid byte sequence for encoding "UTF8": 0xed6d2c HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client_encoding". at ./rt3-on-mysql-to-pg.pl line 45. Use of uninitialized value $values[2] in join or string at ./rt3-on-mysql-to-pg.pl line 45.A v tabulce je jen prvních zhruba 30 záznamů. Podle chybové hlášky, z dokumentace a pomocí google jsem získal dojem, že problém bude ve špatném kódování vkládaných znaků do databáze Pg. Nemůžu ale přijít na způsob, jak to opravit. Nastavení client_encoding, NAMES ani CHARACTER SET nepomohlo. Co ještě můžu vyzkoušet?
push @values, decode("utf8",$row->{$key});a vkládání zpět do databáze:
$sth->execute(@values) || die $@ . "\n ".encode("utf8",join(",",@values));Skript zpracuje úspěšně 3500 řádků v tabulce (předtím 30). Pak ale opět skončí s chybou:
DBD::Pg::st execute failed: ERROR: invalid byte sequence for encoding "UTF8": 0xfd
use locale; binmode(STDOUT, ":encoding(UTF-8)"); binmode(STDIN, ":encoding(UTF-8)");ani nastavení
LANG=en_US.UTF-8
a LC_ALL=en_US.UTF-8
nepomohlo.
Vypadá to na problém se sloupcem Content. Když ho vyřadím z exportovaných dat, tak se import povede.
my $sth = $old_handle->prepare("SELECT Created,id,TransactionId,Parent,MessageId,Subject,Filename,ContentType,ContentEncoding,Headers,Creator,Created FROM $table) || die $@;
Sloupec Content je v MySQL typu longblob
v PostgreSQL typu bytea
. Takže otázka zní: Jak dostat v perlu data ze sloupce longblob
do sloupce typu bytea
?
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.