情報リテラシーの最近のブログ記事

最近買った本

| コメント(0) | トラックバック(0)  

 ようやく秋らしい季候になってきたかな?と思う今日この頃です。
 読書の秋ではありませんが、アフィリエイトのテストを兼ねてこの間買った本2冊紹介します。




 一応読んで見ましたが、「ソーシャルメディア炎上事件簿」のほうはちょっと軽いかな?と感じました。この手の話を知らない人であれば、十分ためになるとはおもいますが。
 逆に「システムはなぜダウンするのか」のほうは若干専門知識が必要になりますから、一般の方は読みづらいだろうなと思います。

 今カバンのなかにもう1冊あるのですが、これがなかなか読了しません。通勤電車の中で読むつもりなんですが、読書よりも眠気のほうが勝っていて・・・。困ったものです。

 前回の続きです。

 Excel にはデータベース関数として
  Daverage(), Dcount(), Dmax(), Dmin(), Dsum()
などがあります(全部で12)。上に挙げた関数はデータベースでもよく利用されているものですね。
 前回も説明したのですが、このパラメータは
 Dcount(Database, フィールド, Criteria)
となっています。第1パラメータの"Database"は、対象となるデータの範囲を指定し、フィールドは計算したい列で、条件を"Criteria"に指定することになります。
 "Database"の1行目には必ず項目名を指定することになります。この項目名がないと、条件を指定することができません。

(図1 データ)

image3.gif

image4.gif例えば、
  Dcount(a1:o5,3, Criteria(b1:c2))
であれば、Q0で1と答えた人の中でQ1を1と回答した数を求めることになります。
 この条件は"Q0で1と答え、かつQ1で1と答えた"となります。つまり"Q0=1 and Q1=1"ということ。ですから、criteria の指定は右図のようになるのですが、ここで注意したい点がいくつかあります。
 まず、必ず項目名を指定すること。Database として指定されている範囲の1行目が項目名になるのは上で説明しましたが、Criteria ではこの項目名を正しく指定する必要があるのです。これを間違えて入力すると集計が可笑しくなってしまいます。
 で、複合条件の場合、ANDは行方向でORは列方向で指定します。ですから、上の"Q1で1と答え、かつQ1で1"の指定が"b1:c2"になるのです。じゃあ"Q0で1もしくは2と回答し、かつQ1で1と答えた"という条件はどのように指定すればいいでしょう。
image5.gif
 単純に考えれば、(Q0=1 or Q0=2) and Q1=1 となりますから、左図のように指定するばいいと思えるのですが、さにあらず。excel の場合は"()"を指定できませんので、"Q0=1 and Q1=1 or Q0=2 or Q1=1"のように指定しなくてはいけません。ですから、下図のように入力しておいて、

image6.gif
  =Dcount(a1:013, ,Criteria!b1:C4)
にしないと正しい回答数がもとめられません。これちょっと嫌らしいようにも思えるのですが、慣れてしまえば簡単です。

 Dcount はフィールドを指定しなくても問題がありません。これはSQLを思い出してもらえれば判ると思いますが、SQLの場合
  Select Count(*) from table where Q1=1
のように指定しますよね。この"*"と同じことで、条件に当てはまる行数を返すのですから、列を指定する必要はないのです。ところがそれ以外の関数は列を指定しないと計算できません。ですから、
  =Dsum(a1:013,3,Criteria!b1:c4)
のように列番号(左端を1とします)もしくは項目名を指定することになります。列数が少ないときには列番号でも問題ないですが、項目数が多くなると数え間違いをしやすいので、なるべく項目名を指定したほうが間違いないと思います。

 最後に、"Database"ですが、毎回同じ範囲を指定しますんで、普通は名前をつけます。これは最初に指定したい範囲をドラッグしておいて、メニュー「挿入」→[名前」→「定義」から名前を指定すればOKです。できれば、英語というか、英数文字で指定したほうが、関数を入力する時に面倒でなくていいと思います。
image8.gif

 先日、ひさびさにアンケート集計の処理をしました。これ無給なので最初は「この関数使えば、簡単にできますからやってみて下さい」と言っていたのですが、結局私が集計することになってしまいました。

 で、備忘録ではないですが、その処理方法をここに残しておきます。
 アンケート集計は基本的に excel を使います。設問数や選択肢が多い場合には Access を使うことになるのですが、通常の集計であれば、excel で問題ないです。この制限に関しては、excel のセルの行・列数の制限が max となります。

0.アンケートの形式
 アンケートの設問には単一回答と複数回答の2種類に加えてフリー入力の3パターンあります。選択は集計できますが、フリー入力は当然のことながら集計できません。入力するだけで、あとから人間が判断することになります。

1.アンケートの入力
 1行1レコードで、列が設問の回答を入力することになります。
image1.gif
 上の図のように入力するのですが、1行目は設問タイトルになります。このタイトルですが、集計のことを考えて、Q1 など簡単な形式にします。
 選択肢が1つしかないものは、そのまま選択肢の番号を入力すればいいのですが、複数回答の場合は選択肢の数だけ列を作ります。選ばれた選択肢のところに1を、それ以外はなにも入力しません。 上の図で見ると、設問は問0~問5まであり、問2だけが複数回答の設問になります。
 A列はNoになっています。アンケートの回答用紙にはそのような欄はないのが普通ですが、入力時に、ナンバリングしたほうがいいです。

2.単一回答の集計
 単一回答の集計の場合は簡単です。例えばQ1の選択肢が1~5までの場合であれば、
  =countif(C2:C14,1)
で1と回答した数が判ります。これを5まで変化させれば数が判ります。全体の回答数は
  =count(c2:c14)
で求められますので、1と回答した割合は
  =countif(c2:c14,1) / count(c2:c14)
となります。

3.複数回答の集計
 基本的な考え方は、その選択肢を選んだ回答はいくつあるかになります。ですから、1つの選択肢を1つの設問と見なせば、回答数は簡単に求められます。問題は回答割合をどう考えるかになります。母数を全数で処理できるのであれば簡単なのですが、1つでも選択した回答数を母数にするとなると、ちょっとやっかいそうに見えます。
 私の場合は、1列追加して(その列をOとします)、その列に
  =sum(D2:I6)
と計算式を設定します。これを全ての行に適用すると、全く選択されなかった回答は0になり、1つでも選択された回答は1以上になりますので、1以上になったものをカウントすればよいことになります。
 ではそれを関数で表現するにはどうすればいいか?。countif を使って
  =countif(D2:D14,"O列で1以上のもの")
えっ、この条件は入力できません。じゃあどうするかというと、ここで
  Dcount
という関数を使います。これはデータベース関数の1つなのですが、これは
  =Dcount(database,フィールド,Criteria)
image2.gifとなります。ここの database は d1:d14 で、フィールドは未入力で構いません。Criteria ですが、新しいシートかどこか空いたところに右図のような入力をします。セルA1には集計したい列につけた名前を、セルA2には集計条件を入力することになります。で、今回の計算はQ2sumの列が1以上(つまり0より大きい)ものですから、図のように入力すればいいことになります。
 で、Q2の選択肢1を選んだ割合は
  =countif(d2:d14,1) / dcount(d1:d14,,criteria!a1:a2)
で求められます。

 アンケート集計には、ピボットを使えという書籍は多いのですが、報告書の形式などを考えると、データベース関数を利用するほうが便利なんじゃないかと思っています。criteria の指示を変えればいろんな集計が出来ますからね。

 気が向いたら、criteria の指定例をいくつか説明します。

 経産省(だったと思うのですが)が中心となって、オープンガバメントラボというサイトを開いています。経産省の情報プロジェクト室(@openmeti)からのtweetで、オープンガバメントラボで「災害時におけるTwitter情報の活用について」という報告がサイトにアップされていることを知りました。

 この報告書では震災後のtweetをテキストマイニングという手法を用いて、twitterで流れてくるtweetを分析しています。興味深かったのが、「不足品一覧の推移分析」です。時間が経つにつれ、不足品が変わってくることがよく判ります。報告書では

災害直後から一貫して電力についての不足感が高く、電力についての不足感が高く、電力についての不足感が高く、情報や血液に関するTweetは時間と共に減って時間と共に減っている。また、ボランティアについては一定の期間が経ったあとに不足感が立ち上が立ち上っている、このように大まかな傾向を把握することが可能である。
とあります。

 問題点もきちんと指摘しています。それは、1)retweetにより、分析結果が変化することと、2)エリア別の分析ができていないことです。retweetについては、RTという文字列があるtweetを除けばなんとかなります。でも、エリアは重要なファクターで、場所によって不足品が異なる場合がありますから、この精度を上げることが必要になるのでしょう。
 tweetする人の情報として所在地があるのですが、これを正しいかどうかの判断が難しい。tweetに場所情報をきちんと入れてあり、かつtweetしている人の所在地情報がきちんと登録してあれば、精度も高くなるのではないかと思います。

 この報告は日本の1省庁に留めるのではなく、全世界に伝えてることで、災害復旧に役立てることができるのではないかと思いました。

 お昼前に高木さん(@HiromitsuTakagi)のツイートを見て、リブラサポーターズクラブのページに「"Librahack" 共同声明」なるものが発表されているのを知りました。で、図書館のページにも「図書館ホームページ閲覧障害に係る経過等について」というページが公開されました。

 岡崎市民として、また一介のプログラマとしても、この動向はかなり気になっていたのですが、1つの決着がついたというところなんでしょうが、どうにも納得できないところが、被害届を取り下げなかったことです。サポーターズクラブに「"Librahack"共同声明に関する詳細情報」というページがあって、

被害届を取り下げない理由
被害届の扱いには、きわめて慎重な判断を要します。同時にそれは、提出の必要があれば実施をためらってはならないものです。もし、今回これを取り下げることになると、次に何かあったときに「本当に出していいのか」と、提出をためらうことがあるかもしれません。
もし、被害届の提出をためらった結果、市民生活に多大な悪影響が出るとすれば、これは大変なことです。中川氏は、その危うさを理解し、行政の判断を受け入れました。そもそも中川氏は「取り下げ」という形にこだわっておらず、この声明は実質的な要求に応えるものとなっています。
とあります。ここには「1回取り下げると、次に被害届を出すことに躊躇するから取り下げない」とあるんですが、なんで取り下げたら次に提出をためらうことになるんでしょう。どうしても信じられませんね、ここのパラグラフは。
これはいわゆる「公務員の無謬性」という間違った考えから来ているんでしょうか。責任を取らされることを怖がっているんでしょうか。なんともやり切れない気持ちになってしまいました。
 
それともう一つ気になることがあります。それは今後の対応策についてです。私の感覚では同じ間違いを起こさないために、マニュアルなんかを作成しなければならないと思うのですが、それについて全く言及されていません。
今回の事件はソフトウェアを作った企業(MDIS)の不手際とソフトにバグがあったことが一番の原因だと思ってます。でも図書館には全く非がなかったとは思えません。百歩譲って非がないとしても、今後同じようなことが起こらないように対策を講じる必要があります。
図書館として今回での一番の教訓は「ソフトベンダ-の話を鵜呑みにするな」ということだと思います。ということは、図書館としてなんらかの手順を定めることで正しく処理され、それによって被害届の提出/取り下げが個人の責任問題にならずにすむのではないかと。

今回の声明発表で、#librahack こと中川氏の名誉はそれなりに回復されたんでしょう。でも100%回復されたとは言い難い。被害届の取り下げをすることで、ほぼ100%回復されるのではないかと。

今後も同じようなことが起こるようであれば、市民税払いたくないなと思った私でした。

 見積書を作成して、いざPDFに出力しようとしたら、「ライセンス認証さてにない・・・」とメッセージが出て作成できませんでした。このメッセージ、たまにでます。再起動すればOKなのですが、なんでだろうと思って adobe のサポート窓口に電話してみました。

 窓口に出てくれた人はあまり慣れていないようで、つっかえながらサポート情報の番号を教えてくれたのですが、そのページに書いてあることが症状に合わないように思えたので、ちょっと突っ込んで聞いてみると案の定うまく答えられません。
 いくつかのやりとりをしてから、ちょっと強引にテクニカルサポートのほうから電話をしてもらよう手配、で午後に電話をもらいました。

 さすがにテクニカルサポートの人は話がよく判っていて、こちらが納得できる回答をもらえることができました。納得できたところは、トラブル発生の原因です。一応、私は20年以上いろんなコンピュータのハードやソフトウェアを扱ってきた経験があります。だからというのではないですが、その原因がわからないとどうしても納得できません。最初のサポート窓口ではその原因をうまく説明できなかった。そこが「あっ、こりゃ聞いてもあかんわ」と思った理由です。

 これが素人というかあまり経験がない人であれば最初の対応で問題ないんでしょう。でも今回の私は、それでは不満であった。このミスマッチを埋めるのは簡単ではありません。というか多分大きな会社では無理だと思います。そういう点では、今回テクニカルサポートから電話をもらえたということは顧客サービスとしては及第点以上のものでしょう。それは判っているのですが、なんだか不満なんですね。

 で、もう一度指示されたページを見てみたら、原因のところに「ライセンス認証が行われていないか、ライセンス認証データが破損しています。」とありました。納得できない理由はここにありました。その症状が出たときに再起動すれば必ず復旧します。となると「データが破損」しているとはどうしても思えない。
 テクニカルサポートでは、「何らかの原因でデータにアクセス出来なかった可能性もあります」と言っていました。この一言で満足できたのです。データは破損していなくても、ハードディスクへのアクセスに問題があれば、同じ症状が出るということです。

 最初のサポート窓口でそんなことを言われても、戸惑う人が多いだろうとも思います。「そんなことを言われてもなんともならない。はやく解決策を提示してくれ」と思うでしょう。私が求めすぎている部分も多いとは理解できています。

 判っているからこその表題です。でもなんとかならないものかなぁ。

 とあるところから、「遠隔会議をしたいので、ちょっと考えてくれ」と依頼されたものですから、ちょっと調べてみました。

 普通、会議は1ヶ所に集まって議論するのですが、本支店間という状況だと、skypeのようなもので結べば簡単です。でも参加者が複数でかついろんなところにいる場合は難しい。今のところskypeでのビデオ会議は5人までです。それ以上だと接続できません。そこで、思い切って「顔が見えなくてもいいじゃん」と割り切ることができるとskypeは25人まで大丈夫ということなので、そのまま利用できます。
 実際に25人接続するのは、マシンスペックや通信速度の問題で、うまくいかないようですけどね。じゃあ資料はどうするのか。普通は予めファイルで送ればいいのですが、間に合わなかったり、"Your Eyes Only"だったりするとき、どうしましょうかとうことで、表題の画面共有ということになります。
 これは1人のPCで資料を開いて、参加者はその画面が見られるようにするということなのですが、問題は接続できる人数の制限です。当然通信回線の速度や安定性に影響されてしまいます。

 でいくつか調べたところ、3つほど候補が挙がりました。それが
 (1)realVNC
 (2)Microsoft SharedView
 (3)TeamViewer
です。それぞれメリット・デメリットがあるのですが、私は(1)のrealVNCが一番楽なんじゃないかと思っています。ただこの場合は固定IPアドレスを取得しておくか、DynamicDNSを確保しておかないとできない。それが一番のネックです。
 あとの2つは固定IPアドレスを取得する必要はありません。が、どうしてもクライアントに専用ソフトを入れないといけないというところが一番のネック。参加者がトラブルなしに、自分でインストールできればいいのですが、詳しくない人が入った時点で泣きそうになるかも知れません。
 (3)のTeamViewer はその点を解消する方法があるのですが、同時接続数がどのくらいなのかが、調べ方が悪いんでしょうが、不明というところが不安なところ。どうも無料バージョンは同時接続数が「3」とありますので、多分自分を入れて4人なんでしょう。

 あるサイトでskypeを最大数(25人)接続にトライした報告(Skype会議を25人でやるとどうなるか?)を載せているところがあります。ここを読んで、skypeを使った遠隔会議の大変さがよくわかりました。

 結局みんな集まってやるのが一番いいんだということが再認識できたような気がします。
 ただペーパーレス化を考えると、参加者は全員PCを持っていないと難しいですね。参加者のPCのリテラシーに大きく影響されるんだなと、これも再認識してしまいした。

 まだまだ暑い日が続きます。とはいえ、9月に入りましたから2学期が始まりました。が私の仕事は8月もほとんど休みがなかったんですね。
 下旬から8月コースの実務補習の指導が始まり、30日にようやく終わったと思ったら、翌31日からは東海学園大学の実習です。それに加えて産廃診断と支部機関誌の原稿作成などなど目が回るほどの忙しさ。睡眠不足の日が続いています。

 自分の仕事以上に気になっている事件が1つあります。それが librahack 事件。以前にもエントリーを書いたのですが、かなり進んできました。これについては電総研の高木(@HiromitsuTakagi)さんのご尽力が大きいし、朝日新聞の神田(@kanda_daisuke)さんが新聞で事件を掘り起こしたことも影響しています。それに杉谷(@Vipper_The_NEET)さんが作ったまとめサイトは今回の事件がどんなものだったかをわかりやすく説明しています。

 その流れのなかで、市議会議員(@YanaseTooru)の方が9月の定例議会で質問されるとのこと。6日は仕事が入っていて、岡崎にいないのが残念でなりません。

 Twitter の #librahack のハッシュタグで熱い議論がされています。まとめサイトを含めて是非読んでほしいなと思い、このエントリーをアップしました。

 あまりwebやネットの世界に詳しくない人からすると、小さな事件に思えるのかもしれませんけど、私も含めてこれはものすごく重要な事件だと確信しています。

 ITMediaで『企業のTwitter活用の実態――MMD研究所調べ』という記事があり、そこには

「企業でのTwitter導入に関する動向調査」の結果を発表した。同調査によると、企業活動にTwitterを活用している企業は、回答者全体の2割以上となった。
とありました。
 最近 Twitter がメディアに露出する機会がかなり多くなり、積極的に取り組んでいる企業も見られます。でも、上の引用文章を見ると「回答者全体の2割以上」とあります。「回答者」ってどんな人なんでしょうか。
 記事をよく読んでみると、
企業のTwitter導入について、モバイル利用者を中心としたMMD研究所のパネル(登録回答者)およびTwitter経由で募ったユーザーから回答を集めた。調査期間は4月9日から14日で、有効回答数は673件。回答者の企業の業種トップ3は「Web・モバイル制作」(17.5%)、「オンラインメディア・コンテンツ運営」(12.8%)、「総合・一般広告代理店」(11.7%)である。
とあります。となると企業の広報部などの対外窓口からの回答とは限らないんですね。
 その点をさっ引くと2割以上というのがちょっとなぁと思えてしまいます。

 確かにいまツイッターはブームになっていますね。いろんな人が利用しているし、企業もアカウントを取っていろんな情報を流すようになりました。でもどのくらいかを調べる術はあるんでしょうか。どうも Twitter はユーザー数などを発表しないらしく、マスコミなどに出てくる数字は推測ばかりです。
 そういった中で「20%以上」という数字が一人歩きするのが恐いなと思います。
 まあ、アンケートは回答者が所属している会社のことを聞いていると思いますから、それほどずれていないと思いたいんですけどね。

 Twitter で堀江貴文氏のつぶやきで知ったのですが、産経新聞に『横浜市大中国人留学生 電気通信事業法違反容疑で逮捕』という記事が出ました。この記事だけだとどうも自宅でサーバーを立てるだけでも法律違反になりそうな気持ちになってきます。
 でもそんなはずはないと思い、ググってみたら今回の事件について、詳しく調べた人がいることがわかりました。そのブログエントリーが『自宅サーバを無届けで設置すると逮捕される? 』です。

 やはり、サーバを立てただけで罪になることはなかったので、一安心というところですかね。でも意外な落とし穴がありました。そのエントリーにあった「電気通信事業参入マニュアル[追補版]― 届出等の要否に関する考え方及び事例 ―」(pdf・総務省電気通信事業部データ通信課)を読んでみたら、クローズドチャットの運営とか無料のグリーティングカードのサービスをするのは届け出が必要になるようです。多少の知識があれば、これらを無料で運営できるんですが、あまり派手にやると捕まるようですね。また「いわゆる『ポータルサイト』、『SNS(Social Networking Site)』など、様々なサービスを包含した総合サービスについては、それぞれのサービス毎に電気通信事業として登録又は届出を要するかどうかを判断することとなる。」とあります。
 まあこぢんまりとしたサービスの提供は問題ないんでしょうけどね。

 今回また1つ勉強になりました。

2012年5月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

アーカイブ

お気に入りリンク

OpenID対応しています OpenIDについて

人気ブログランキング

最近のコメント

最近のトラックバック

Techonrati

Technorati search

» リンクしているブログ