NanashiNoGombe 0c9b7d46c1 HTML2Dat: implement generator using itest.5ch.net json | 4 maanden geleden | |
---|---|---|
lua | 1 jaar geleden | |
parson | 2 jaren geleden | |
.gitignore | 3 jaren geleden | |
BBS2chProxyAuth.cpp | 1 jaar geleden | |
BBS2chProxyAuth.h | 1 jaar geleden | |
BBS2chProxyBoardManager.cpp | 1 jaar geleden | |
BBS2chProxyBoardManager.h | 1 jaar geleden | |
BBS2chProxyConnection.cpp | 4 maanden geleden | |
BBS2chProxyConnection.h | 1 jaar geleden | |
BBS2chProxyFormData.cpp | 1 jaar geleden | |
BBS2chProxyFormData.h | 1 jaar geleden | |
BBS2chProxyHTML2Dat.cpp | 4 maanden geleden | |
BBS2chProxyHTML2Dat.h | 4 maanden geleden | |
BBS2chProxyHttpHeaders.cpp | 6 maanden geleden | |
BBS2chProxyHttpHeaders.h | 1 jaar geleden | |
BBS2chProxyKeyManager.cpp | 5 maanden geleden | |
BBS2chProxyKeyManager.h | 6 maanden geleden | |
BBS2chProxyPoster.cpp | 4 maanden geleden | |
BBS2chProxyPoster.h | 6 maanden geleden | |
BBS2chProxyRawSocket.cpp | 1 jaar geleden | |
BBS2chProxyRawSocket.h | 2 jaren geleden | |
BBS2chProxySecureSocket.cpp | 1 jaar geleden | |
BBS2chProxySecureSocket.h | 2 jaren geleden | |
BBS2chProxyThreadInfo.h | 1 jaar geleden | |
BBS2chProxyThreadPool.h | 2 jaren geleden | |
BBS2chProxyURL.cpp | 1 jaar geleden | |
BBS2chProxyURL.h | 1 jaar geleden | |
IBBS2chProxySocket.h | 1 jaar geleden | |
LICENSE | 3 jaren geleden | |
Makefile | 1 jaar geleden | |
Makefile.mingw | 1 jaar geleden | |
README.md | 1 jaar geleden | |
dependencies | 1 jaar geleden | |
hmac.c | 1 jaar geleden | |
hmac.h | 2 jaren geleden | |
main.cpp | 6 maanden geleden | |
stringEncodingConverter.c | 1 jaar geleden | |
stringEncodingConverter.h | 1 jaar geleden | |
utils.h | 1 jaar geleden |
5ch.netからdatを取得し、クライアントに返すプロクシです。 接続先が*.2ch.netの場合、内部でURLを*.5ch.netに変換した上で接続を行います。
起動し、各ブラウザのプロクシ設定を変更してください。デフォルトではポート9080で接続を受け付けます。以下のオプションが指定可能です。
-p port
ポート番号を指定します。デフォルトは9080です。
-t timeout
タイムアウト(秒) を指定します。デフォルトは30秒です。
-a user-agent
proxy2chからリクエストを行う際のUser-Agent
ヘッダを指定した値で上書きします。指定しない場合はクライアントがヘッダに付与した値がそのまま送信されます。
-g
全ての接続を受け付けます。これを指定しない場合は、同じマシンからlocalhost(127.0.0.1)
への接続のみを受け付けます。
-c
HTTP CONNECT
リクエストを受け付けます。httpsなプロクシとして動作するようになりますが、このオプション単体ではリクエストの改変は行えないので透過的なプロクシとしてのみ機能します。
-4
強制的にIPv4で接続します。
--proxy server:port
プログラムが使うプロクシサーバを指定します。
socks4://192.168.1.1:1080
のように頭にsocks4://
やsocks5://
を付けると、socksプロクシを指定できます。
-b backlog
listen関数で接続を待ち受けるソケットのbacklogの値を指定します。デフォルトは32です。
-s
*.2ch.net, *.5ch.net, *.bbspink.comドメインへの接続をhttpsで行います。
--api AppKey:HmacKey
このオプションを指定すると、5ch/bbspinkの読み書きにAPIを利用します。読み込みはread.cgi経由ではなくAPIで直接datを取得します。いわゆるApp keyとHMAC keyの2つをコロンで連結して与えてください。なお、bbspinkへの書き込みについてはbbs.cgiがAPIに対応していないためデフォルトではAPIは使われません。2023年7月10日をもってAPIが停止したため、このオプションを指定しても動作しません。
--api-usage read|post|all|postinclpink|allinclpink
--api
オプションが指定されたときにAPIを使う用途を指定します。read
を指定すると読み込みのみ、post
を指定すると書き込みのみ、all
を指定すると読み書き両方にAPIを使います。デフォルト値はall
です。postinclpink
あるいはallinclpink
を指定することでbbspinkへの書き込みにもAPIを使うことができます。
--api-auth-ua user-agent
--api-dat-ua user-agent
APIのSID取得時、dat取得時のUser-Agent
ヘッダの値を指定します。
--api-auth-xua X-2ch-UA
--api-dat-xua X-2ch-UA
APIのSID取得時、dat取得時のX-2ch-UA
ヘッダの値を指定します。
--api-server server
APIのゲートウェイサーバを指定します。デフォルト値はapi.5ch.netです。
--api-override
APIを使ったdat取得リクエストを受け取った場合、proxy2chが代わりに取得して返すようになります。--api
オプションと同時に指定した場合、proxy2chで指定したAPIキーを使って取得したものを返します。--api
オプションを指定しない場合、read.cgi経由あるいは直接 (--direct-dat
と併用した場合) 取得したものを返します。MITMが有効になっていなくてもオプション自体は有効ですが、APIリクエストは基本的にhttpsで来るはずなのでMITM前提です。
--chunked
素通しする接続に対して、Transfer-Encoding: chunked
なレスポンスをchunkedなまま送り返します。
SofTalk WEBというソフトがこのオプションを指定しないと動かないようです。
--verbose
多少詳しくログを表示します。
--bbsmenu URL
URLで指定したアドレスを板リストとみなし、HTMLのリンク中に出現する"5ch.net"の文字列を"2ch.net"に、"https://"を"http://"にそれぞれ置換します。
--bbscgi-header "header: value"
5ch.netのbbs.cgiに接続要求する際、指定したheaderのリクエストヘッダの値をvalueに上書き (存在しない場合は追加) します。オプションを複数指定することで複数のヘッダを書き換えることができます。
valueの部分に%HOST%
もしくは%BOARD%
もしくは %THREAD%
という文字列が含まれている場合、%HOST%
はリクエスト先URLのホスト名に、%BOARD%
はリクエストボディから取得した掲示板の名前に、%THREAD%
はリクエストボディから取得したスレッドのkeyにそれぞれ置き換えられます。
--bbscgi-postorder "field1,field2,..."
5ch.netのbbs.cgiに接続要求する際、指定した順序にリクエストボディのフィールドを並べ替えます。順序はカンマ区切りでフィールド名を指定してください。指定しなかったフィールドは指定したものの後に続きます。
--bbscgi-utf8 none|api|all
5ch.netのbbs.cgiにPOSTされるリクエストボディを (Shift JISから) UTF-8に変換するかどうかを指定します。none
を指定すると変換は行われません。api
を指定すると--api
オプションによって書き込みにAPIが使用されるときにのみ変換が行われます。all
を指定するとAPIが使用されるかによらず変換が行われます。デフォルト値はapi
です。なお、all
を指定した場合でもLuaスクリプトでAPI関係のヘッダが追加された場合には (署名が不一致になる可能性があるため) 変換はスキップされます。
変換元のリクエストボディが既にUTF-8になっていると思われる場合はそのまま送信されますが、その場合も含めてContent-Type
ヘッダにapplication/x-www-form-urlencoded; charset=UTF-8
という値が暗黙のうちにセットされます。
--bbscgi-lua path
5ch/bbspinkのbbs.cgi
にPOST
リクエストが送られる直前にproxy2chから呼び出されるLuaスクリプトのパスを指定します。
このスクリプトにwillSendRequestToBbsCgi
という関数を定義することにより、proxy2chがbbs.cgi
に対して送るリクエストヘッダ/ボディを自由に改変することができます。詳しくはサンプルスクリプトを参照してください。
--bbscgi-header
オプションと同時に指定した場合、まず--bbscgi-header
オプションによりヘッダの改変が行われ、その後にこのオプションで指定したスクリプトが実行されます。
--gikofix
ギコナビで5ch.netに書き込めない問題を解消します。bbs.cgiにPOSTする際のbody末尾の余計な改行を取り除きます。
--mitm minimal|all
-c
オプションと同時に指定することでいわゆるMITM proxyとして動作するようになります。--mitm minimal
とすると5ch.netやbbspink.com等proxy2chが介入する可能性のあるドメインへの接続のみMITMを行い、--mitm all
とすると全てのHTTP CONNECTで受け取った接続に対してMITMを行います。
--mitm-ca-cert path
MITMモードでサーバ証明書の署名に使うPEM形式の(自己署名)認証局証明書を指定します。
--mitm-ca-key path
MITMモードでサーバ証明書の署名に使うPEM形式でパスフレーズなしの秘密鍵を指定します。
--mitm-certgen
--mitm-ca-cert
と--mitm-ca-key
で使える自己署名CA証明書 (有効期限3年) と秘密鍵を生成してPEM形式で標準出力に出力して終了します。
--num-threads #threads
スレッドプール内で待機させるスレッド数を指定します。デフォルト値は8です。
--keystore path
APIを使った書き込み時に払い出されたMonaKeyを保存するJSONファイルをのパスを指定します。このオプションを指定するとMonaKeyが更新された時にパスのファイルが作成・更新され、起動時にファイルに保存されたMonaKeyが復元されるようになります。
--direct-dat
dat取得リクエストを受け取った時、read.cgiの出力を加工するのではなく、/板名/dat/***.dat
(現行ログ) あるいは/板名/oyster/***/***.dat
(過去ログ) にあるファイルを直接取得して返します。
MacのBathyScapheやThousandのように、システムのプロクシ設定を利用し独自のプロクシ設定が不可能な場合は、付属のproxy.pac
のようなプロクシ設定ファイルを使うと良いかと思います。
最近のOSX(10.10だけ?)では、同じドメインのサーバに対して既にキープアライブ状態の接続があるとプロクシ経由での接続を行ってくれないらしく、そのような場合はproxy_yosemite.pac
のようにプロクシ経由にするアドレスを増やしてみるといいかもしれません (究極的には全ての2ch.net/bbspink.com向けの接続をプロクシ経由にすれば解決するはず)。
なおOSX 10.11.5以降では、安全性のためにpacファイルに完全な(ドメイン名以降のファイルパスを含む)URLが渡されない仕様になったらしく、urlのマッチングを使用したpacファイルは機能しません。proxy_10.11.5.pac
のように2ch.net/bbspink全体を対象にするか、各ブラウザが独自にプロクシ設定に対応することを期待する以外ないようです。
read.cgi経由モードでは、既に直接datを取得したことのあるスレッドに対してこのプロクシ経由で差分取得を行う場合、(主に半角スペースの個数を厳密に再現できないために)不整合が起こる可能性があります。この場合、一度ログを削除して再取得を試みてください。API経由とread.cgi経由を切り替えて使うような場合も同様の問題が起こります。
-s
オプションを指定した場合、使用するlibcurlがTLS/SSL対応でビルドされている必要があります。libcurlがバージョン1.1.0未満のOpenSSLもしくはバージョン2.9未満のLibreSSLを使う場合、スレッドセーフを保証するためにロック処理を行う関数を明示的に設定する必要がありますが、proxy2chはこれを行いません。これが原因でクラッシュが発生する可能性があるので、該当するバージョンのOpenSSL/LibreSSLをどうしても使わなければならない場合はこれを参考にロック処理を実装してください。
--bbscgi-lua
オプションを使うためにはLuaのヘッダ類を用意した上でUSE_LUA
マクロを定義してビルドし、libluaにリンクする必要があります。このオプションを使わないのであればLuaは不要です。
今の所実験的な機能です。-c
オプションでhttpsプロクシを有効にした上でMITMモードを有効にするとhttpsなリクエストに介入することが可能になります。有効にするにはビルド時にUSE_MITM
マクロを定義する必要があります。WindowsやMacにおいてもビルドにはOpenSSL (LibreSSL含む) あるいはGnuTLSのヘッダ・ライブラリ類が必要です。USE_GNUTLS
マクロが定義されている場合はOpenSSLの代わりにGnuTLSがバックエンドとして使用されます。
OpenSSLを使う場合は1.1.1以降のバージョンを推奨します。3.0以降ではデフォルトではSHA-1を使う暗号スイートが低セキュリティとみなされており、JaneStyle等の古いOpenSSLに依存したアプリとのハンドシェイクが成立しません。そのため、セキュリティレベルを下げることで互換性の改善を行っています。この措置が不要な場合はOPENSSL_NO_SECURITY_DOWNGRADE
マクロを定義してビルドを行ってください。
USE_ECDSA_KEY
マクロを定義してビルドすると署名にRSA (2048bit) ではなくECDSA (P-256) を使うようになります。サーバ側の処理がRSAに比べて高速 (OpenSSLでのベンチマークでは数十倍の差) なので、貧弱なマシンで動作させる場合はCPU負荷が有意に小さくなる可能性があります。ただし、クライアントが古いOSで動作している場合は対応していない可能性があります。OSレベルでの対応状況はWindowsはVista以降、MacOSは10.6以降、iOSは4以降、Androidは4以降で対応のようです。
MacとLinux等Un*xでは、Makefile
を使います。
Windows (MinGW/MSYS) の場合、Makefile.mingw
を使います。
Macの場合、たぶんそのままコンパイルできるはずです。
その他Un*x系の場合、libcurlとlibiconv、libcrypto(OpenSSL)もしくはGnuTLSが入っていなければ入れましょう。libcurlがSSL/TLS非対応だとAPIに接続できないので注意してください。
Windowsの場合、MinGW/MSYSだけではライブラリが不足しており、コンパイラが認識するよう各ライブラリ/ヘッダ類を適切にインストールする必要があります。以下にMinGWを用いてWin32向けのバイナリを生成する際に必要なファイルの入手先の例を示します。