「ハッピーセット」のコンプ問題

マクドナルドの「ハッピーセット」の「星のカービィ」が、大人気ですぐ売り切れたそうですね。

「カービィ」のおもちゃは4種類。では、セットを何個買えば、4つのおもちゃをコンプリートできるのか。

たった4個買った時点で4個揃う超ラッキーもあれば、100個買っても揃わない可能性だってあります。

その「期待値」の計算方法を考えてみようと、ふと思ったのですが、解法の糸口が見つかりません。

受験生時代なら簡単だったかもしれませんが、いまこの問題を私は解く自信がありません。

とりあえず、4個買ってコンプリートできる確率を考えてみます。

全入手パターンは4の4乗で256通り。コンプリートは、4つの順烈じゃなくて順列なので、4の階乗で24通り。

なのでその確率は、256分の24で9.375%。

次に、5個目でちょうどコンプリートできる確率。

・・・え〜っと、すみません。終了。脳ミソがオーバーヒートしそうです…

この問題、「ガチャコンプ(コンプガチャ)」の確率や期待値として、以前からよく知られているようです。

そして、その計算法も常識レベルのようで、私の数学力の劣化(ていうか消滅)を思い知らされた次第。

答だけ書くと、期待値 = 4/4 + 4/3 + 4/2 + 4/1 = 8.333回。そうですか。

等確率が前提なので、一部のおもちゃがとくにレアだったりすると、期待値も格段に増えることになります。

あるいは、マックの店員さんの「人的ファクター」が加わる可能性もあり、計算通りにはいかないでしょう。

なんにせよ、コンプリートしたくなるハッピーセット「星のカービィ」戦略は、成功だったようですね。

「横好き」な数学

「数学者は宇宙をつなげるか? abc予想証明をめぐる数奇な物語」

今夜のNHKスペシャルがまた、私の数学熱を少しだけ、呼び覚ましてくれました。

高校1年の時までは、数学者になることを夢見ていましたが、高3までに諦めて良かったと思っています。

努力して叶うものではないし、いくら運が良くてもダメです。つまり天才が必要なのです。

しかし今思えば、数字に対する偏執的な趣向は、小学時代からありました。

学校が休みの日は、外に出て遊ぶことなどほとんどなく、いつも自宅で「計算」をしていました。

たとえば、1、2,4,8,16と、2の累乗を筆算して、いつもより丁寧な字で、ノートに書き続けていました。

その数値の桁数がドンドン増えていくことに、一種の快感を覚えたのでした。

中学時代にはこれが、素数に置き換わります。数学好きなら誰でも通る道かもしれません。

フィールズ賞を受賞した、郷土出身の広中平祐氏が話題になったのもこの頃で、私の数学熱は最高潮でした。

ちなみに広中先生の講演を、20年ぐらい前に、その会場の最前列で聴いたことがあります。

内容はすばらしかったのですが、極端に話し下手で、ひっかかりもっかかりの特異点だらけでした。

そして最も印象的だったのは、演壇横に置いたカバンの角度を、講演中に何度も修正される先生の姿でした。

高1の担任は、外見がピグモンにそっくりな、若い数学の先生でした。

先生は私に「数学序説」という本を紹介してくれました。すぐに買いました。読みふけりました。

するとかえって、私の熱は冷めていきました。純粋な数学の世界に入り込めそうな気がしなくなったのです。

結局、医学部に入りましたが、数学の道に進んでいたらどうなってただろうと、今でもときどき思います。

なので今夜のような番組を見て、横好きな数学への興味が続いていることを再認識するのです。

「順列組み合わせ」が好き

「ファイザー」と言えば、いまや誰もが知る製薬会社です。新型コロナワクチンの代名詞とも言えるでしょう。

あるとき、「ハイザー打てますかね」と尋ねる高齢の方がいました。モデルナの副反応が気になるようです。

でもそれ以前に、「ハイザー」の響きが懐かしくて、言葉を訂正するようなことはしませんでした。

子どもの頃(60年代)、わが家に「ハイザー」がありました。「自動計量米びつ」のことですね。

当院スタッフの自宅や実家では、まだ大切に使っているお宅もあるようで、その寿命の長さには敬服します。

1・2・3のレバーがあって、押すとそれぞれ1合・2合・3合のお米が、はい、ザーッ、と出てきます。

4合以上必要なら、レバー操作を何回か繰り返せば目的量のお米が得られるという、画期的な台所用品です。

その、小さな数のたし算が必要だというところが、幼少期の私にはとても興味深い学習機材でもありました。

子ども心に、5合のときはどのレバーを押そうか、6合ならどうしようかと、シミュレーションしていました。

5合だと3→2の順なんですよね、2→3じゃなくて。最初になるべく多く確保したい気持ちのせいでしょうか。

6合は3→3が順当だけど、1→2→3もアリなはず。いや、3→2→1だって、2→1→1→2だってあるはず。

私は昔から、「数列」とか「順列組み合わせ」とかが好きでした。もちろん「純烈」とは無関係です。

でも、純烈のメンバーから2,3人のユニットが何通りできるか、という問題なら「純烈組み合わせ」ですかね。

過払い金の返還額

「過払い金」返還についてのテレビCMを、最近よく目にしますね。とくにアディーレ法律事務所。

「おひとりあたり平均160万円」という回収実績を謳っていますが、過払い金の平均値って何でしょう。

正規分布に従うはずもない過払い金を<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-17.html" target="_blank" title="単純平均">単純平均</a>しても、何の情報にもならないどころか、誤解を招くだけです。

たとえば、こういうことです。過払い金返還の対象者が10人、回収額が平均160万円とします。

1人が突出して1,510万円、他の9人が10万円ずつ、合計1600万円、という場合でも、1人平均160万円です。

このように、金額の平均値というのは、とびぬけて巨額な事例によって、大きく上ぶれしてしまうのです。

アディーレ法律事務所は、その錯覚を利用して、返還金額を大きく見せようとしているような気がします。

確認のためアディーレのサイトを見ると、「過払い金事例紹介」として、6つのケースが挙げられていました。

その6つの事例の返還額はそれぞれ、60、396、430、98、92、246万円、平均220万円です。

これまた、返還額を大きく見せる事例ばかりを並べた印象があります。

「過払い金回収実績」を見ると、2つの数値が記載してありました。

過去全ての回収金額は、285,222件で1,614億324万円。平均額は約56万円。160万円には遠く及びません。

最近1カ月間の回収金額は、4,978件で31億165万円。これでも平均で約62万円。

テレビCMでいう「160万円」の根拠を探すと、「2014年1月~12月当事務所実績より算出」とあります。

つまり過去全体の実績でもなければ、最近の実績でもない、ちょっと古い実績を前面に出しているようです。

たぶんその頃の実績が、いちばん良かったのでしょう。そう考えてしまうので、余計うさん臭く感じるのです。

手元に素数を

<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-1573.html" target="_blank" title="史上最大の素数">史上最大の素数</a>を、自分の目で見たい、できれば手元に置きたい(?)。素数好きなら、きっとそう思うはず。

探したら、ありました。その素数をダウンロードできるサイトが。さっそくゲットです。無料です。

しかしそれは、ただただ数字が延々と続く、約22MBのテキストファイルでした。そりゃそうでしょうけど。

文字数をカウントすると、22,338,618字。これは、報じられている素数の桁数に一致します。間違いない。

なるほど、1バイト文字が2200万あれば、22メガバイトになるんですね。そこにも納得。

それにしても、2200万桁の恐ろしく巨大な数値が、正確にダウンロードできるということに驚きます。

まあ、当たり前と言えば当たり前。単なる文章と思えば、2200万字なんて、・・・いや、かなりの分量です。

新聞一紙の文字数は、約11万文字(22万バイト)だそうなので、件の最大素数は新聞100日分に相当します。

紙面全体に素数だけ印刷しても、100日かかるというわけ。こりゃ3日目で飽きるか(初日から飽きる?)。

総文字数が約1500万字といわれる広辞苑があるのだから、素数だって1冊の本にできますね(誰が買う?)。

ダウンロードした文書は、1行に数字100個、1ページ57行、全3920ページ。印刷する気には、なりません。

最終ページだけは、3行と18文字。文字数を計算すると、100 x 57 x 3919 + 318 = 22,338,618。OK。

この文書を見れば、その史上最大の素数の何桁目の数字が何か、ということが一目瞭然。すばらしい。

たとえば、私の生年月日にちなんで19600917桁目の数値は、6です。私のプライムナンバーと言えましょう。

だからどうした、って話ですが。まあ、素数を手にしたという、所有欲は満たされました。(だからどうした)

過去最大の素数発見

過去最大となる、約2233万桁の素数が発見されました。「そーすか」とか言ってる場合じゃありません。

世界中の研究者が、より大きな素数を探すプロジェクトの中で、今回のそれは見つかりました。

「2のn乗-1」という形の素数を探そうという、「グレート・インターネット・メルセンヌ素数探索」。

インターネットを介して100万台以上のコンピュータを接続した、分散コンピューティングによる成果です。

これまでの最大素数は、2013年に発見された1742万桁。今回の発見で、桁数はずいぶん飛躍したものです。

素数は無限に存在するので、このような大発見は今後も限りなく繰り返されるのでしょうか。

いま「素数は無限に存在する」と書きましたが、なぜそんなことが言えるのか、その証明法は簡単です。

最大の素数をNとしたとき、すべての素数の積=2x3x5x…xNに1を加えた数は、どの素数でも割り切れません。

つまりそれは、新たな素数ということになります。これはNが最大の素数であることと矛盾します。てな感じ。

<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-40.html" target="_blank" title="円周率">円周率</a>の桁数追究とは異なり、素数探求の進歩は、<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-1111.html" target="_blank" title="暗号業界">暗号業界</a>にも大きな影響を与えそうです。

<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-596.html" target="_blank" title="前にも書いた">前にも書いた</a>ように、よく使われている重要な暗号が、素数を利用しているからです。

でもいつか、だれか天才が、画期的な素数発見手法をあみ出すんでしょうね、きっと。

もうその頃には、素数なんて、偶数と同じぐらい簡単に見つかるものに、なっているかもしれません。

棒グラフと折れ線グラフ

「秋には本は売れないのに、なぜか『読書の秋』」という新聞記事に、目が留まりました。

3月4月や、年末年始や、夏休みなどに比べると、秋は相対的に売れ行きが鈍る時期だそうです。なるほど。

が、その内容よりも、月別の「書籍への支出額」の平均値を比較した棒グラフが、とても気になりました。

支出額が年間最高の12月と比べて、11月はその半分にも満たない、ように見えるからです。

実際には、12月は900円強、11月は700円弱なのに、棒グラフではその差がきわめて強調されています。

なぜなら、縦軸が途中で省略されていて、棒の高さが数値に比例していないのです。

棒グラフは、その長さの絶対値どうしを比べるのが本筋。縦軸は0から始まらなければなりません。

差を強調するために、棒の先っちょの部分だけを切り取って比較するのは、ルール違反です。

テレビや新聞ではしかし、縦軸を操作したインチキグラフをよく見かけます。

ところで、高血圧の方には、毎日朝晩の血圧を測定して、血圧手帳にグラフを描いてきてもらいます。

このように、血圧や体重や体温などの経時変化を記録するときは、折れ線グラフを使います。

折れ線グラフであれば、見たい範囲を強調するために、縦軸を自由に設定できます。

だから血圧や体重のグラフの縦軸が、0から始まる必要はありません。絶対値ではなく、変動を見たいのです。

体温に至っては、その数値は絶対値ですらありません。どうしても絶対値で描くなら、縦軸は絶対温度です。

科学雑誌のグラフにも間違いは散見されますが、テレビや新聞に登場するグラフはひどいのが多い。

縦軸に細工がしてある棒グラフを出すようなメディアは、科学的分析能力を疑わなければなりません。

ジョン・ナッシュ氏死去

「ゲーム理論」。と言っても、モンストとかパズドラとかの、攻略法の話ではありません。

経済分析に使われる理論で、これを突き詰めたジョン・ナッシュは、94年にノーベル賞を受賞しました。

そのナッシュ氏が昨日(日本時間)、死亡したとのこと。タクシー乗車中の事故というのが、残念です。

統合失調症と闘いながら、ついにノーベル賞を受賞したナッシュ氏の半生は、映画にも描かれました。

2001年のアカデミー作品賞などを受賞した「ビューティフル・マインド」は、私の大好きな映画です。

主演のラッセル・クロウも良かったけど、奥さん役のジェニファー・コネリーもまた、良かった。

人生ドラマの中に、私の好きな要素「スパイ」「暗号」「数学」が盛り込まれているところもポイント。

では「ゲーム理論」とはなんぞや。この機会に、ちょこっと勉強したので、私なりの解釈を書いてみます。

個人間でも企業間でも国家間でも、二者間でも三者間でもそれ以上でも、駆け引きというものがあります。

それぞれが自分の利益を考慮しつつも、相手の出方を想定し、裏をかかれないように、熟慮します。

メンバーがすべて、同様に合理的戦略を練ると、一定の均衡「ナッシュ均衡」に落ち着くというわけです。

一人勝ちすることよりも、一人負けしないことを重視する意思決定法、というのが私の理解です。違うかな。

違うかもしれないので、人に言わないでください。

そんなわけで今夜、ナッシュ氏追悼の意味で、急遽、「ビューティフル・マインド」を鑑賞しました。

精神的に病的な個性を持つ天才が、さまざまな苦悩の末、ついに大事を成し遂げて社会から賞賛される。

その天才を支え続けた奥さん。その2人が同時に事故で亡くなったというのが、なんともいたたまれません。

かけ算の順序問題

昔からある、かけ算の順序問題を、あらためて考えてみました。

「ひと皿にリンゴが5個、そのような皿が4つあります。リンゴはぜんぶで何個ですか」

「皿が4枚、それぞれの皿にリンゴが5個乗っています。リンゴはぜんぶで何個ですか」

いずれの設問も、式を書いて答えるなら「5x4=20(個)」でも「4x5=20(個)」でもよさそうです。

しかし、かけ算は「ひとつぶんの数xいくつ分」の順に書くのがきまりだ、という考え方があります。

一方で、かける順序などどうでもよい、という合理的な考え方もあります。答えは変わらないからです。

「皿にリンゴが5個、そのような皿がワゴンに4枚、そのようなワゴンが3台。リンゴはぜんぶで何個ですか」

自然に考えると「5x4x3=60(個)」です。リンゴの数が、かけ算で増えていくイメージが分かり易い。

これを「4x5x3」としたら、わずかながら違和感を感じます。

さらに「5x3x4」とすると、さらに強い違和感を感じます。かける順序が理に適っていないからです。

まず皿の数に着目して「4x3x5」というかけ順もあるでしょうが、これは少々へそ曲がりです。

かけ算の順序を意識することは、自分が求めようとしているものを、きちんと確認することになります。

その意味では最初に、求めるものの数(リンゴの数)を持ってくるのが、いちばん自然で理に適っています。

正答であればいいという合理性よりも、思考過程の理屈こそ、とりわけ教育上は重要だと思います。

双子素数予想

数学上の未解決の難問「双子素数予想」の解決につながる論文が出た、と報じられました。

これは、11と13のような間隔が2である<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-364.html" target="_blank" title="素数">素数</a>のペア(双子素数という)は無限に存在する、という予想です。

ああそうですか、素数なんて私には何のかかわりもありませんけど、とおっしゃる方。それは大間違いです。

ネット上を飛びかう情報は、素数を利用して<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-160.html" target="_blank" title="暗号化">暗号化</a>されているからです。そのひとつが「RSA暗号」。

RSA暗号については、たくさんの解説サイトがありますが、その多くが数式や図表を含み、複雑難解です。

そこで今日は、思いっきり簡略化した解説に挑戦してみます。双子素数の話はまた後日です。

(1)たとえば、「3」と「33」という2つの公開された鍵を使って、17という数値を暗号化する場合

17を3乗したものを33で割った余り29が暗号。3と33が公開されているので、だれでも暗号化が可能です。

(2)秘密の鍵「7」を使って、受け取った暗号29を復号する(元の数値に戻す)

29を7乗したものを33で割った余りがなんと、元の数値17になるのです。7を知っていれば復号は簡単です。

ある数値を3乗して33で割った余りを、7乗して33で割った余りは、必ず元の数値になるというのがミソ。

このような面白いことが起きるのには、3と33と7に、一定のルールがあるからです。

まず、33は2つの素数の積であること。33=3x11です。

次に3は、それらの素数から1を引いた数の積の約数ではないこと。3は(3-1)x(11-1)=20の約数じゃない。

そして7は、3との積が、先の素数から1を引いた数の積+1の倍数になるように選ぶ。7x3=20+1です。

このようにすればなぜ(1)(2)が成り立つのか。それを私に聞かないで下さい。

もちろん、33という小さな数値では、33=3x11と簡単に<a href="http://tsuruhara9linic.blog116.fc2.com/blog-entry-389.html" target="_blank" title="素因数分解">素因数分解</a>され、秘密の7はすぐバレます。

実際のRSA暗号では、33の部分には、300桁程度の巨大な数(=2つの素数の積)を用いています。

このぐらい大きな数になると、いまのコンピュータを持ってしても、素因数分解には年単位かかるそうです。

桁数の大きな素数の積は、それを素因数分解するのがきわめて困難。これが暗号に利用される理由です。

だから、効率的に素因数分解を行う方法が見つかったとき、RSA暗号は破られるわけです。

双子素数だとかの、素数を巡る謎が解明されるたびに、暗号業界はドキッとしているのでしょう(たぶん)。