Unicode, 構文解析, 生活, 独自研究, 検索エンジン, ボット
その他
広く使われているUnicode規格を理解し, エンコーディングの手法, UTF-8, UTF-16, UTF-32, を理解して, 多言語の文字コードを扱えるようになることを目指します. 具体的に, UTF-8, UTF-16, UTF-32間の変換方法をC++で実装し, 手法はできるだけ速い方法を用います.
本稿では, C++でバージョンに左右されずに文字を扱うために, 以下の機能を持つライブラリを紹介します.
- 型依存しないUTF-8, UTF-16, UTF-32間の相互変換
- UTF-8, UTF-16文字(コードポイント)ごとのイテレート
- 標準イテレータを使ったイテレート
- 型依存しないイテレータの対応
広く使われているUnicode規格を理解し, エンコーディングの手法, UTF-8, UTF-16, UTF-32, を理解して, 多言語の文字コードを扱えるようになることを目指します. 具体的に, UTF-8, UTF-16, UTF-32間の変換方法をC++で実装し, 手法はできるだけ速い方法を用います.
OutlineTextのパーサ(Parser)について
広く使われているUnicode規格を理解し, エンコーディングの手法, UTF-8, UTF-16, UTF-32, を理解して, 多言語の文字コードを扱えるようになることを目指します. 具体的に, UTF-8, UTF-16, UTF-32間の変換方法をC++で実装し, 手法はできるだけ速い方法を用います.
本稿では, C++でバージョンに左右されずに文字を扱うために, 以下の機能を持つライブラリを紹介します.
- 型依存しないUTF-8, UTF-16, UTF-32間の相互変換
- UTF-8, UTF-16文字(コードポイント)ごとのイテレート
- 標準イテレータを使ったイテレート
- 型依存しないイテレータの対応
データベースを使わないで, あいまい検索を実現するPHPライブラリ
文章を書くという行為は, 日常でよく行われます. その際, 他人にわかりやすく書こうとしますが, なかなかそうはいきません. 何から書き始めていいのか, どのようにして文章を続けるか悩みます. ここでは, 筆者なりにわかりやすい文章を書くということについて考察します.
インターネット上で調べものをするとき, 検索エンジンを使用してインターネット上にある膨大なコンテンツを絞り込みます. ただし, 日本国内で検索エンジンのサービスを利用すると, 日本を対象としたコンテンツが検索対象になります. そのため, 英語で書かれた最新の技術情報や, 論文, 公式のリファレンスがヒットしずらい問題があります.
本稿では, 日本国内にいながらも, 海外の検索エンジンサービスを利用できる方法を提示します.
データベースを使わないで, あいまい検索を実現するPHPライブラリ
ここには, TwitterBotに関することが書かれます.
筆者が現在作成中のTwitterボットは以下のリンクからBOTのたまり場
目的は以下のとおりです.
- 誰もが簡単にTwitterBOTを導入できるような枠組みを提案すること
- 自然な会話ができること
- 自動で学習すること