October 14, 2023

Here are some corrections regarding "Detecting Fake News — with a BERT Model"

I managed to  get through this https://medium.com/@skillcate/detecting-fake-news-with-a-bert-model-9c666e3cdd9b.

Here are corrections I made to "make it work" (to quote Tim Gunn).

1. In the first chunk, I made the following change: 

(This works) from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay
(This does not work) # "from sklearn.metrics import plot_confusion_matrix" , which was shown in the post is deprecated (I am writing this in October 2023).
plot_confusion_matrix does not work.
This BERT for dummies post is dated about an year ago, and yet Scikit-learn does not like plot_confusion_matrix anymore... 
2. Before I ran the first chunk, I created a folder and directory in my Google Drive--I am using Google Colab--, so that the followinig cd works.
%cd /content/drive/MyDrive/1_LiveProjects/Project11_FakeNewsDetection
2. In the second chunk, the first two lines to load data did not work at first try.
Of course because I did not have these csv files, duh! 
First, you have to download the files from Kaggle. Also, "a1_True.csv" and "a2_Fake.csv" do not work unless you renamed Kaggle datasets. You rather need:
true_data = pd.read_csv('True.csv')
fake_data = pd.read_csv('Fake.csv')
3. The fine tuning segment that begins with "# Train and predict" take time. In my case, it took over an hour. 
4. The segment that builds a classification report, which begins with "# load weights of best model" gives an error.
Specifically this line does not work:
# path = 'c1_fakenews_weights.pt'
because in the precedeing segment, the path was given in a different name, "c2_new_model_weights.pt."
So, I rather have to write: 
path = 'c2_new_model_weights.pt'

| Comments (0)

August 15, 2023

映画 Oppenheimer

原作のAmerican Prometeusを数年前に読んでいたこともあり、見たかった映画。美しいCillian Murphyもよいですが、Robert Downey Jr.の開き直った敵役の演技が素晴らしい。とくにファンというわけではないのですが、引き込まれる役者さんです。豪華キャストなのに、他が霞む勢いだと思いました。Ally McBealでの軽薄な感じも好きだったのですが、Lewis Straussとして、老けまくっているところがすごい。シワを強調するのは照明の仕事か、メイクのワザなのか、わかりませんが、老獪な感じがよかったです。ご自身もキャリア上重要な作品と位置づけているようです。

Gary Oldmanはこの映画ではTruman大統領。あっちの映画ではChurchill首相だったけど、どちらもうまくハマっている感じでした。映像で見るとTruman本物はもう少し品位がある感じですが、Oppenheimerをcrybaby呼ばわりする流れ上、やや俗物ぽい感じで映画の上ではよいのだと思います。

話が込み入っていて、回想シーンも多いです。史実を正確に再現しているシーンも多く、原作を読むとか、ある程度勉強をしてから見た方が理解できる作品だと感じました。Oppenheimerが核の国際管理を提唱したこと、水爆開発に反対したことで、めんどくさい人になっていく過程はMcCarthyismと重なっているわけで、その辺の歴史的文脈を踏まえるか否かで、見方も相当異なるのではないかと思います。

The Day after  Trinityと重ねてみる向きもあるようです。The Day after Trinityも物理学者の視点からマンハッタン計画を扱っているわけで、ドキュメンタリと伝記映画の違いはあるものの、このあたりの歴史を理解するには両方見た方がいいと私も思います。

映画Oppenheimer は、Trinityが終わってファインマンがボンゴ叩いているところとか、ドラマチックな反応が強調されますが、The Day after Trinityの物理学者の述懐ははるかに抑制されています。

Security clearance を剥奪される過程は、Alan Turingを彷彿とさせます。国ってなんだろう、科学者の貢献てなんだろう、そして戦争って何だろう、と考えさせられました。

 

| Comments (0)

July 31, 2023

Malinowskiの日記

Malinowskiの日記A Diary in the Strict Sense of the Termは、部分的には読んでいました、なんなら読み聞かせまでされたこともあるのですが、今回初めて腰を据えて読みました。

めっぽうおもしろい。日記が出版されちゃうなんて、書いた側には悪夢ですが、読む側にとっては出版していただいてありがたいです。

また仕事しないで小説読んじゃった、とか、体調が悪いからヒ素を飲んだ(昔はヒ素はクスリとされていたらしい)とか、反省と愚痴、なんならいろいろな人の悪口もてんこ盛り!Malinowski 普通の人すぎる!複数の女性に思いを寄せるのも、正直だけど、ぜんぜん褒められない!お茶飲んだとか、小さなことまでTMI!今だったらソーシャル・メディアにはまってそう。

でも、困難なフィールドワークの中で、セラピー的な意味があって書かれたであろうことは理解できます。実際、心がけについてもいろいろ書かれています。文章はただの変な人の喚きに見えるかもだけど、風景の描写も映画のシーンみたいで上手いし、フィールドワーカーらしい、心のスケッチなのだと思います。

研究者が何に悩んでいるのか、悩むべきか、という指針としてもおもしろい。日記が書かれた時期は第一次世界大戦があり、Malinowski はポーランド出身だから理論的にはオーストリア国民で、パプア・ニューギニアにいたら収監される可能性もあったのに、それでもフィールドワークをしていたというのがすごい。

Malinowski は強烈とか、ナルシシストという評も見ましたが、私はそういう印象は受けませんでした。言いたくなる気分はわかるなあと思いました。日記は自省的で、研究にまつわるボヤきを芸術の域に高めたという印象です。なんだ、こんなヘタレでもいいのか、と妙に安心もしたり。研究者に必要なある種の偏屈さを、結晶にしてサンプルにしてくれたような感じです。

大学院生にとくにお勧めしたいかも。

 

| Comments (0)

«学歴と学校威信 うまくいかないときの考え方