[PHP-dev 1542] Re: mb_convert_encodingの問題とサニタイズ関数

classic Classic list List threaded Threaded
5 messages Options
Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

[PHP-dev 1542] Re: mb_convert_encodingの問題とサニタイズ関数

Yasuo Ohgaki
2013年6月29日 4:40 Yasuo Ohgaki <[hidden email]>:
大垣です。

この動作は前から気になっていたのですが、バグレポートが出ています。

mb_convert_encoding breaks well-formed character

new function for replacing ill-formd byte sequences with substitute characters
https://bugs.php.net/bug.php?id=65081

Ruby 2.1には文字エンコーディングを綺麗にするメソッド(scrub)が入るようです。名前で分かる関数があるのは良いことだと思います。
コミット権限を持たない方でも


をフォークしてパッチを作ってPull Requestを送れます。PHPは古いブランチから新しいブランチへのマージが標準なのでPHP5.4から始めると良いと思います。ワークフローは


に書いてあります。


申し訳ないです。
件名を入れずに送信してしまいました。

--
Yasuo Ohgaki 
[hidden email]


_______________________________________________
PHP-dev mailing list
[hidden email]
http://ml.php.gr.jp/mailman/listinfo/php-dev
Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

[PHP-dev 1543] Re: mb_convert_encodingの問題とサニタイズ関数

Rui Hirokawa-3
廣川です。

代替文字への変換の動作がおかしいというご指摘ですね。

まず、githubのlibmbflを修正することになりますが、すでにパッチがあるようでしたら、
pull request を https://github.com/moriyoshi/libmbfl にあげていただくか、
私まで送付してください。

私も確認してみます。

(2013/06/29 5:53), Yasuo Ohgaki wrote:
2013年6月29日 4:40 Yasuo Ohgaki <[hidden email]>:
大垣です。

この動作は前から気になっていたのですが、バグレポートが出ています。

mb_convert_encoding breaks well-formed character

new function for replacing ill-formd byte sequences with substitute characters
https://bugs.php.net/bug.php?id=65081

Ruby 2.1には文字エンコーディングを綺麗にするメソッド(scrub)が入るようです。名前で分かる関数があるのは良いことだと思います。
コミット権限を持たない方でも


をフォークしてパッチを作ってPull Requestを送れます。PHPは古いブランチから新しいブランチへのマージが標準なのでPHP5.4から始めると良いと思います。ワークフローは


に書いてあります。


申し訳ないです。
件名を入れずに送信してしまいました。

--
Yasuo Ohgaki 
[hidden email]



_______________________________________________
PHP-dev mailing list
[hidden email]
http://ml.php.gr.jp/mailman/listinfo/php-dev


-- 
Rui Hirokawa twitter:@rui_hi

_______________________________________________
PHP-dev mailing list
[hidden email]
http://ml.php.gr.jp/mailman/listinfo/php-dev
Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

[PHP-dev 1544] Re: mb_convert_encodingの問題とサニタイズ関数

Yasuo Ohgaki
大垣です。

2013年6月30日 1:00 Rui Hirokawa <[hidden email]>:
代替文字への変換の動作がおかしいというご指摘ですね。

まず、githubのlibmbflを修正することになりますが、すでにパッチがあるようでしたら、
pull request を https://github.com/moriyoshi/libmbfl にあげていただくか、
私まで送付してください。

残念ながら見た限りでは無いようです。私も中身までは見ていません。。。
レポートしているのは塙さん(?)のようなので聞いてみるのも良いかも知れません。

--
Yasuo Ohgaki
[hidden email]

_______________________________________________
PHP-dev mailing list
[hidden email]
http://ml.php.gr.jp/mailman/listinfo/php-dev
Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

[PHP-dev 1545] Re: mb_convert_encodingの問題とサニタイズ関数

Rui Hirokawa-3
廣川です。

ill-formed utf-8の代替文字処理の件、取り急ぎ、
https://github.com/moriyoshi/libmbfl
のコードを修正しました。

しばらく確認して問題がみつからなければ php にもコミット/プルします。

サニタイズ関数の導入については他の方のご意見もうかがいたいところです。

(2013年06月30日 05:46), Yasuo Ohgaki wrote:

> 大垣です。
>
> 2013年6月30日 1:00 Rui Hirokawa <[hidden email]>:
>
>> 代替文字への変換の動作がおかしいというご指摘ですね。
>>
>> まず、githubのlibmbflを修正することになりますが、すでにパッチがあるようでしたら、
>> pull request を https://github.com/moriyoshi/libmbfl にあげていただくか、
>> 私まで送付してください。
>>
>
> 残念ながら見た限りでは無いようです。私も中身までは見ていません。。。
> レポートしているのは塙さん(?)のようなので聞いてみるのも良いかも知れません。
>
> --
> Yasuo Ohgaki
> [hidden email]
>
>
>
> _______________________________________________
> PHP-dev mailing list
> [hidden email]
> http://ml.php.gr.jp/mailman/listinfo/php-dev
>

_______________________________________________
PHP-dev mailing list
[hidden email]
http://ml.php.gr.jp/mailman/listinfo/php-dev
Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

[PHP-dev 1546] Re: mb_convert_encodingの問題とサニタイズ関数

Yasuo Ohgaki
大垣です。

2013年6月30日 11:57 Rui Hirokawa <[hidden email]>:
ill-formed utf-8の代替文字処理の件、取り急ぎ、
https://github.com/moriyoshi/libmbfl
のコードを修正しました。

しばらく確認して問題がみつからなければ php にもコミット/プルします。

ありがとうございます。
mbflのコードはあまり良く読んでいないので助かります。 
 
サニタイズ関数の導入については他の方のご意見もうかがいたいところです。

私は、他の言語でもscrubという名前で実装するようなので、mb_scrub()は入れ
た方が良いと思います。実質mb_convert_encoding()のエイリアスで良いと思い
ます。

セキュリティ対策には必須なのですが、言語レベルで文字エンコーディングの
バリデーション/サニタイズが必要ない、という人が多くてなかなか他の言語
で類似の関数が実装されませんでしたが、やっと気が付いてきたようでよかっ
たです。

--
Yasuo Ohgaki
[hidden email]

_______________________________________________
PHP-dev mailing list
[hidden email]
http://ml.php.gr.jp/mailman/listinfo/php-dev
Loading...