Widelab

2011-08-16_Widelab會議記錄 ( GRSK : A Generalist Recommender System )

widelab | 17 八月, 2011 12:39

To 孟澤 :

(1) content-based RS technique: 公式分母的部分( │RT上標u│ )要瞭解清楚是什麼值。

(2) collaborative RS technique: 是一個很方便的方法,先前使用者的喜好選擇若跟目前使用者的選擇相似,就可用來作base。

(3) Hybrid Technique: 公式的ACi值要比別人說明得更清楚是如何計算得到的。

(4) 針對Group規劃是一個很棒的目標。

2011_8/2 會議記錄

widelab | 07 八月, 2011 13:53

To 郁堂 :

(1) word和phrase的定義要弄清楚。

(2) chain length的定義是 : (eg.當代表 = 當代  +表 , chain length是1)。

(3) 老師說;投影片的內容就是報告內容,報告者要照著投影片內容做解說。

(4) 投影片內容不用放這麼都多字,多放些重點,不要一直看手稿。

(5) 報告時,前後關鍵字的講法要一致。

(6) paper內容要先消化理解。

(7) 地名、人名還有專有名詞是斷詞最容易出錯,試想有沒有辦法只用一套方法來分析來做詞的斷詞分析。

(8) 斷詞的意義要了解。 

2011-04-27_Widelab會議記錄

widelab | 27 四月, 2011 02:22

 

孟澤 :

 1.evaluation alg : Input : 兩個不路徑的集合 S & S'

  why S集合還要考慮(依使用者喜好程度跟時間的集合)不符合規定還要考慮進去?

 2.為什麼要用GA alg? 兩種 兩段路交換(似2-optimal)、一段路突變

 3.Define 最後要做到的程度 以及你需要的一些參數(時間、花費、喜好、etc...)

 4.參數要怎麼來(獲得來源?)

 5.怎麼排程? 使用者旅遊的方式、型態?

 6.重新規畫的部分可以考慮進去 演算法

2011_04_13

widelab | 13 四月, 2011 02:24

1 看CHO 這篇PAPER,看實驗哪種方法比較好,差別在哪裡

2 真正online不可能用原來pagerank,因為運算複雜,看別人是如何改良

3 a page few outlink ......再去看一下

4 看過的url比下載的多5倍

5 why 只使用2.4byts來儲存?

6 此實驗室說用BFS一樣可以在前幾天將熱門的網頁抓下來

7 10t時間問題,這是指同一個sit,這是為了防止把同一個server弄掛,

   避免在極短時間去抓取同一個server的網頁,policy,想想看

2011_3_02

widelab | 02 三月, 2011 03:07

孟澤

A Travel .....

1 記住這個會議以後可以投

2  P集合是對Sk裡所取出來

3 PK應該是只類別,一個景點可能會有多個類別

4 P是不是也可以代表一個目的或景點

5 Q2是認為此景點為什麼東西

6 C為每個主觀評價值大於0的地方

7 ak應該算是客觀的值,為系統設定

8 第一天越早到飯店,就有較多時間遊玩,可是之後越早到飯店的話,應該遊玩時間會變少,因為要休息了

9 實驗部分 : 景點如何取出來(VK) ,樹狀圖如何建??

10 景點的分數給太簡單,不應該只有0和1

11 這是單一景點的,若是環島之類要如何規畫

 

 

2010.12.23_LabMeeting

widelab | 23 十二月, 2010 02:48

卡資:

  *沒有路徑的可以作 有路徑的就一定可以做

  *鄰居:指的是鄰近X的點

  *找不到的時候怎麼辦? robot就不動?

 

lab_meeting 2010/11/9

widelab | 09 十二月, 2010 02:13

孟澤

1. "public transport travel planning" 已經達到八把萬次的查詢

2. 文中所指的車子,為使用者自行駕駛,而非大中運輸

3. initiating the STIS service 此方式為一直運算搭何種大眾交通工具,所花的時間會最短
   並且部不只用單一種的交通工具,用混搭方式

4. 當運算時間很長時,就會縮短回應的時間

5. 可以幫使用者產生旅遊路徑

6. 現在規劃大多都是公車站牌為起始點與終點


1. 寫一個程式,拿大四的景點名稱,到google做搜尋,並抓取有多少個pages個數,作為景點的
   分數,並寫入資料庫


2. 規劃路線,平滑點~

2010.11.18_Lab Meeting

widelab | 18 十一月, 2010 02:47

孟澤 :

  Geotagged Photo Recognition using Corrseponding Aerial Photo Multiple Kernel Learning

  •   Multiple Kernel Learning 公式中Bj如何得到? Bj為權重值 paper內無提到kernel為何
  •   如何比較此篇paper沒仔細提到
  •   空拍圖與平視圖能夠對照比對 經緯度座標更精準
  •   SIFT方法請讀
  •   自己論文的主軸 分類 取景點etc...

卡資 :

  基於大尺度路網路動態路況資訊的車輛路徑規劃演算法

  •   Heuristic函式 看所有得結點除於他的總距離 會不會算到起點的位置 
  •   演算法行車路徑 主要道路會有比較高的優先權 會先行探索
  •   如何挑選upper level 節點
  •   改變一點?改變多點?

2010/10/28 meeting

widelab | 28 十月, 2010 03:09

孟澤 (重報) : landmark classiffication in large-scale imagge collections

1. k-maen,一開始的中心的位置隨機?,漸漸往密度高的地方移動,範圍的大小100,以二維座標,找較密集的地方

2. 六千萬張如何變成三千萬張,將差一個街區以上的照片刪除(與實際經緯做比較),如何知道差一個街區?

3. 因為不知道這群是什麼東西,所以用SIFT此方法,擷取出其特徵

4. TEXTUAL,要有三人以上標是同樣標籤,才會將此圖片歸為此標籤

5. vocabulary,他的建立方式為K-MEAN 和 K-NN ,圖所呈現的結果為越多越好,應該太多時會變差,太少時也會比較差

皓塵 :

1. 編碼問題(文字)

2. 有經緯度的照片並不多,可能要改抓"非立刻"的照片

3. 先找幾個使用者,把有經緯度的照片抓下來,幾千張左右(備案)

4. 抓部落格的照片,比較可能有經緯度的資訊,旅遊類的可能比較多

毅民 : parcahyd an arcthitecture of parallel crawler  based augmented hypertext documens

1. mapping 是只跟URL,分成一塊一塊的

2. EXTERMAL 指的是連到別的SIT,並存到buffer裡,而LOACL為直接抓

3. bad url 為,找不到此網頁或是網頁錯誤

 

 

2010.10.15_LABMeeting

widelab | 21 十月, 2010 07:28

阿雄:

  *要強調是做一個Blog System

  *page rank為一個積率的概念,連到一個page機率越高,則分數就越高

  *userProfile不需要特別解釋

  *先講為什麼要做這件事 在講方法

  *cluster放在 userProfile前面講 要先分類才能從userProfile裡得到其歷史訊息 興趣等等

  *研究的方向 Blog System

  *架構可以提到前面一點說明

大學部:

  *對自己的旅程做紀錄

  *要加上跟終點的距離

  *加入的分數須有道理

2010.10.01_LABMeeting

widelab | 21 十月, 2010 07:27

卡資 :

   車用導航系統可以分成兩種:

     -自發式:導航機會自動去偵測附近是否有其他導航機,並且自動交換更新訊息。

     -集中式:統一從中心進行資料更新。

   A*:依照行車距離來做路線的規劃抉擇

   Time-dependent A*:依照行車時間做路線的規劃抉擇

Travel time reliability:針對路線,不是針對人所以每個人若起點終點一樣擇所顯示的路線都是一樣

FVD:車子-車子之間互相傳遞訊息 紀錄的資訊包括:

-路線速度

-位置 ,etc...

*小P曰:

1.可將人的因素加入考慮之,使得最佳路線的規畫精準度上升

2.FVD其交換資訊的時機? Device是否能購得

3.其演算法 正向算 反向算 好處在什麼地方?

4. A*其算出來的結果是否為最佳的

5.本篇paper所指的lateness earlyness所代表的意思是?

 

 =========分隔線==========

劉彥廷:

小P曰:

1.高度扭曲的工作量不平衡的狀況下 為什麼global的方式比較好?

2.下禮拜重報

meeting 2010/10/21

widelab | 21 十月, 2010 04:19

孟澤 : (照片分類)

1. mean shift

照片之分群 : 先找到分群之中心點,在慢慢的位移,直到找到所有照片之中心點

2. 先用k mean 的方法做分類,但因為效果並沒有很好,所以再用ANN的方式來改善

3.實驗,只用文字做分類最好只能到79%,用visual只有57%,混和型86%

4. 由於較有名(TOP 10)照片比較多,所以在做訓練時的效果比較好,所以精準度較高

5. landmark 是什麼? 

6. baseline ,我拿一張照片所猜對之機率

7. visual<visual+時間....

8. human 分類約68%,這是指不給予任何文字描述情形下,只有圖片特徵

   若再加上tag就可以到 76%

9. 所下的視覺特徵的越大(vocabulary sizes ?視覺特徵所用的形容詞),其準確度越高

10. 先用 mean shift,將照片做分群,在取照片的視覺特徵

11. 表格,分類越多,準確率越低;使用越多vocabulary sizes,準確率會提升,但是全部卻比visual的方式更差,有問題

12. 總結,文字加圖片特徵比人高??

 

卡資 : (論文報告)

1. introduction 有點像相關研究

2. 還要重牌一下投影片順序

3. 題目似乎有點大,(集中式路況導航),作系統+路徑規畫?要著重在哪,或是全都作?

4. 把投影片拆開,改成動機 目的的方式

5. 前面介紹沒對路徑規畫沒講很多

6. 如何收集資料

 

2010/8/26

widelab | 29 八月, 2010 13:13

Normal 0 0 2 false false false EN-US ZH-TW X-NONE

孟澤

1 偵測和分析JAVASCRIPT的惡意程式

2 特徵:

一直重新導到不同的網址 (紀錄次數和URL)

 

         JAVASCRIPT通常會用到混淆技巧(函數使用的次數,紀錄函數的長度)

         並沒有把動態語法真正執行出來,再來判斷是否為惡意程式)

 

         根據記憶體漏洞攻擊

        

         攻擊目標大部分為瀏覽器的擴充元件(追蹤擴充元件的個數)

         利用變數OVERFLOW的方式,將原本的CODE覆蓋掉,再用跳躍的函式,跳到想要執行的地方

 

3 擴充元件之記憶體,不安全的API,瀏覽器之記憶體

4 貝式分類

 

大學部四年級

1 台灣地圖太大,點到換顏色

 

                

2010.5.6會議記錄

widelab | 06 五月, 2010 11:48

劉彥廷:

  一:Middleware - Server與Server之間的中介層 

  二: Virtual World: 靜態-不會改變狀態的NPC

             動態-玩家

  三:C++指令中 有buffer功能的指令 - f開頭的都有

  四:在網路層有RTF System幫你搞定 就不需要再去管理網路層需要做些什麼事

  五:Delta Update:只需要Update有差別的地方

  六:三種處理地圖的方式:Zone Server 將地圖切割成很多塊 依照開發者的方式切 static的

              Instance Server 將一小區塊複製到其他Server 每台Server都有相同區塊(使用率較高的)

              Replication Server - So-call active entities

                        - Shadow entities (Read access)

  七:跨區域的方式: 區塊 - 區塊(同一張地圖)

            區塊 - 點(傳送點)

            雙向

 *小P:希望論文方向注重於切割地圖的方式 朝動態切割的方向去思考 地圖走過的頻率

=============================================================

Cloud-論文進度報告:

 一:將字典的字全放入記憶體內 再去做比對的動作 這樣就不需要每次比對都要再去讀取一次字典的字

 二:將Total的infi放入記憶體內 這樣hash會快很多 keyvalue是total的兩倍 這樣可以降低碰撞發生

 三:DF WF = 1 的直接刪掉

 四:把info都寫到同一個檔裡

==============================================================================

大學部:

 一:單一景點的分享方式要再深入思考

 二:遊戲分享(整個行程分享)的方式也要再深入思考

 三:程式碼的部分 和介面的圖的部分 需要再加快速度進行 

 

2010.4.22會議記錄

widelab | 22 四月, 2010 02:15

卡資報Paper

一  (第九頁) 為了避免跟別人碰撞

二  (第十一頁) 先走點還是走線

三  為何要把障礙物拿掉,有何好處,涵義;如果起始點在障礙物附近,先移動到頂點

四  小偷偷水果遊戲,會不會造成農夫全部聚集在一起

五  城市遊戲,會不會造成碰撞,當從兩台車中間穿過時,如果不會,又是如何避免

六  此篇有點沒有關聯

=======================================================

大學部

一  把GOOGLE MAP 套用上來

二  是否能不能用中華電信的MAP

=======================================================

皓塵

一  某些機器有問題,都不會動,有五台抓資料

二  看看抓幾個PAGE

三  rgz如何打開,找老師要函式

四  找HTML的如何把內容PASS出來(趴SER)

五  WGET太慢,抓圖程式另外寫
 
六  先抓一些圖試試看,測試準不準
 
七  寫成LIB,或寫成函式
 
八  程式裡面盡量模組化
 
九  如何在LINUX下如何產生LIB
 
十  曝光時間,ISO,光圈,曝光,閃光是否有打開...等資訊留下來
 
============================================
 
一  下禮拜換劉彥霆和蕭學長報告
 
二  下禮拜RFID投影片要上傳
 
三  英文PAPER要趕快寫
 
 
Accessible and Valid XHTML 1.0 Strict and CSS
Powered by LifeType - Design by BalearWeb