TECH BLOG

サムネイル.png

新卒インターン 不動産×先端技術コースの紹介

本記事は、今年の新卒インターンを全3回で紹介する連載の第1回です。まず、インター...

投稿者:ひつじ

本記事は、今年の新卒インターンを全3回で紹介する連載の第1回です
まず、インターンの全体像とデジタル系の2つのコース(不動産×先端技術/不動産×DX推進)の概要と先端技術コースの取り組みを取り上げます(DX推進コースの記事は今後2回に分けて公開予定です)。
今年の先端技術コースでは、
からくさホテルの宿泊者アンケート(自由記述)を題材に、実務ベースで複数のテキスト分析に挑みました。
インターンの雰囲気や学生がどのような姿勢で分析に向き合ったか
を中心にご紹介します(具体的な数値や結果は割愛します)。

1) インターンとその雰囲気

1-1)インターンについて

ザイマックスグループでは新卒採用の一環として、夏に5日間のインターンを開催しています。
デジタル人材向けには2コースを用意し、
AI活用やデータ分析を実務ベースで体験できる「不動産×先端技術コース」と、当社の不動産総合サービスを支えるデジタル推進部の業務を体験できる「不動産×DX推進コース」があります。

テーマはインターン用の練習課題ではなく、実務で発生した分析をベースにしている点も特徴です。

分析して終わり、ではなく、事業部門の担当者と近い距離で、実際の課題や途中経過の仮説をその場で確認しながら進めました。
時間が限られる中でも、
分析→資料作成→発表練習までどの学生も最後まで熱心に取り組んでいたのが印象的でした。

インターンの合間には社員との座談会も実施。就活や業務のリアルについてフランクに話せる場を用意しました。学生からは、

  • 事業部の方々と距離が近い中での研究開発に類する業務には、とてもやりがいがあって魅力的だと感じました。」
  • 実際のデータを使って分析を行えた点で、若手にも裁量があると感じました。

といった声が寄せられ、現場に近い環境で手を動かす空気感が伝わったのではないかと思います。
(また、学生同士もすぐ打ち解けあっていてインターン期間中にも飲みに行ったり、東京タワー見学にも行ったりしていました!)

1-2)テーマ

からくさホテルの口コミ分析を行っていただきました。
データとなるアンケートは以下のようになっています。

1.png

  • ポジティブなクチコミネガティブなクチコミ(フリー記述)
  • 各項目についてスコア(数値)

これらを宿泊いただいたお客様につけていただいております。
この口コミデータに加え、お客様の属性情報(居住国、人数、宿泊数、部屋タイプなど)も使って分析をしてもらいました。
学生が取り組んでいた分析手法を紹介します。

3) 分析手法

3-1) 共起ネットワーク

言葉同士のつながりを頻度とともに可視化するために使用されます。
下記は一例ですが、どの言葉とどの言葉が同時に現れているかを可視化することができます。
単語の青枠の大きさが言葉自身の頻度、線の太さで言葉同士の頻度を表現することができます。
「スタッフ」と「親切」という言葉が同時に使われていることがわかります。

2.png

3-2) トピックモデル

トピックモデルは、多数の自由記述を潜在トピック(単語分布)に自動整理し、各文書をトピックの混合(割合)として表す分析手法です。
たくさんの文章の中から、潜在的なテーマを自動で見つけ出す分析で文章の全体像を把握することができます。
トピック名を直接出すわけではないため、何についてのトピックであるかは分類後に見て判断する必要があります。

3.png

3-3) 生成AIを用いたFew-shot分類

最後は口コミデータを、あらかじめ用意した部屋・スタッフ対応・朝食・設備・立地・料金・予約・トラブルなどのカテゴリに自動で振り分けることができるFew-shotショット分類です。
生成AIに具体例とルールを見せてFew-shotショット分類で判定し、もしAIの出力があいまいだったり形式が崩れた場合は、キーワード(例:「部屋」「朝食」「Wi-Fi」「料金」など)で補助的に判定します。
これにより、人手で全文を読む手間を減らし、意見をすばやくどのカテゴリについての記述なのかを集計・可視化できます。また複数のカテゴリについて述べてる口コミについてもどちらにも割り振りできるのも利点です。

4.png

3-4) 頻出ワードを用いた順序ロジットモデル

今回は自由記述のアンケートに加えてクチコミのスコアのデータもあったので順序ロジットモデルを活用したチームもありました。
順序ロジットモデルとは被説明変数が「1(不満である)から10(満足である)」のように順序関係を持つ場合に、説明変数と順序的な結果の関係を分析する統計モデル
です。頻出ワードと組み合わせることでどのワードが含まれているとスコアが向上するかを分析していました。

4) インターンを通して

最終日には、事業部門向けに分析結果と改善提案をプレゼンしました。
事業部門からは「学生の自由な発想に基づくデータの捉え方や分析手法が非常に参考になり、大きな刺激を受けた」とのフィードバックをいただいています。加えて、プレゼン中に挙がった追加分析については、本件で構築した分析基盤を土台に、現在デジタル部門で継続実施しています。

おわりに

最後までお読みいただきありがとうございました。
来年の夏も開催予定です。実務ベースでAI/データ分析に挑戦したい方、事業部門と近い距離で議論しながら成果を形にしたい方とお会いできるのを楽しみにしています。