widelab | 17 八月, 2011 12:39
To 孟澤 :
(1) content-based RS technique: 公式分母的部分( │RT上標u│ )要瞭解清楚是什麼值。
(2) collaborative RS technique: 是一個很方便的方法,先前使用者的喜好選擇若跟目前使用者的選擇相似,就可用來作base。
(3) Hybrid Technique: 公式的ACi值要比別人說明得更清楚是如何計算得到的。
(4) 針對Group規劃是一個很棒的目標。
widelab | 07 八月, 2011 13:53
To 郁堂 :
(1) word和phrase的定義要弄清楚。
(2) chain length的定義是 : (eg.當代表 = 當代 + 代表 , chain length是1)。
(3) 老師說;投影片的內容就是報告內容,報告者要照著投影片內容做解說。
(4) 投影片內容不用放這麼都多字,多放些重點,不要一直看手稿。
(5) 報告時,前後關鍵字的講法要一致。
(6) paper內容要先消化理解。
(7) 地名、人名還有專有名詞是斷詞最容易出錯,試想有沒有辦法只用一套方法來分析來做詞的斷詞分析。
(8) 斷詞的意義要了解。
widelab | 27 四月, 2011 02:22
孟澤 :
1.evaluation alg : Input : 兩個不路徑的集合 S & S'
why S集合還要考慮(依使用者喜好程度跟時間的集合)不符合規定還要考慮進去?
2.為什麼要用GA alg? 兩種 兩段路交換(似2-optimal)、一段路突變
3.Define 最後要做到的程度 以及你需要的一些參數(時間、花費、喜好、etc...)
4.參數要怎麼來(獲得來源?)
5.怎麼排程? 使用者旅遊的方式、型態?
6.重新規畫的部分可以考慮進去 演算法
widelab | 13 四月, 2011 02:24
1 看CHO 這篇PAPER,看實驗哪種方法比較好,差別在哪裡
2 真正online不可能用原來pagerank,因為運算複雜,看別人是如何改良
3 a page few outlink ......再去看一下
4 看過的url比下載的多5倍
5 why 只使用2.4byts來儲存?
6 此實驗室說用BFS一樣可以在前幾天將熱門的網頁抓下來
7 10t時間問題,這是指同一個sit,這是為了防止把同一個server弄掛,
避免在極短時間去抓取同一個server的網頁,policy,想想看
widelab | 02 三月, 2011 03:07
孟澤
A Travel .....
1 記住這個會議以後可以投
2 P集合是對Sk裡所取出來
3 PK應該是只類別,一個景點可能會有多個類別
4 P是不是也可以代表一個目的或景點
5 Q2是認為此景點為什麼東西
6 C為每個主觀評價值大於0的地方
7 ak應該算是客觀的值,為系統設定
8 第一天越早到飯店,就有較多時間遊玩,可是之後越早到飯店的話,應該遊玩時間會變少,因為要休息了
9 實驗部分 : 景點如何取出來(VK) ,樹狀圖如何建??
10 景點的分數給太簡單,不應該只有0和1
11 這是單一景點的,若是環島之類要如何規畫
widelab | 23 十二月, 2010 02:48
卡資:
*沒有路徑的可以作 有路徑的就一定可以做
*鄰居:指的是鄰近X的點
*找不到的時候怎麼辦? robot就不動?
widelab | 09 十二月, 2010 02:13
widelab | 18 十一月, 2010 02:47
孟澤 :
Geotagged Photo Recognition using Corrseponding Aerial Photo Multiple Kernel Learning
卡資 :
基於大尺度路網路動態路況資訊的車輛路徑規劃演算法
widelab | 28 十月, 2010 03:09
孟澤 (重報) : landmark classiffication in large-scale imagge collections
1. k-maen,一開始的中心的位置隨機?,漸漸往密度高的地方移動,範圍的大小100,以二維座標,找較密集的地方
2. 六千萬張如何變成三千萬張,將差一個街區以上的照片刪除(與實際經緯做比較),如何知道差一個街區?
3. 因為不知道這群是什麼東西,所以用SIFT此方法,擷取出其特徵
4. TEXTUAL,要有三人以上標是同樣標籤,才會將此圖片歸為此標籤
5. vocabulary,他的建立方式為K-MEAN 和 K-NN ,圖所呈現的結果為越多越好,應該太多時會變差,太少時也會比較差
皓塵 :
1. 編碼問題(文字)
2. 有經緯度的照片並不多,可能要改抓"非立刻"的照片
3. 先找幾個使用者,把有經緯度的照片抓下來,幾千張左右(備案)
4. 抓部落格的照片,比較可能有經緯度的資訊,旅遊類的可能比較多
毅民 : parcahyd an arcthitecture of parallel crawler based augmented hypertext documens
1. mapping 是只跟URL,分成一塊一塊的
2. EXTERMAL 指的是連到別的SIT,並存到buffer裡,而LOACL為直接抓
3. bad url 為,找不到此網頁或是網頁錯誤
widelab | 21 十月, 2010 07:28
阿雄:
*要強調是做一個Blog System
*page rank為一個積率的概念,連到一個page機率越高,則分數就越高
*userProfile不需要特別解釋
*先講為什麼要做這件事 在講方法
*cluster放在 userProfile前面講 要先分類才能從userProfile裡得到其歷史訊息 興趣等等
*研究的方向 Blog System
*架構可以提到前面一點說明
大學部:
*對自己的旅程做紀錄
*要加上跟終點的距離
*加入的分數須有道理
widelab | 21 十月, 2010 07:27
widelab | 21 十月, 2010 04:19
孟澤 : (照片分類)
1. mean shift
照片之分群 : 先找到分群之中心點,在慢慢的位移,直到找到所有照片之中心點
2. 先用k mean 的方法做分類,但因為效果並沒有很好,所以再用ANN的方式來改善
3.實驗,只用文字做分類最好只能到79%,用visual只有57%,混和型86%
4. 由於較有名(TOP 10)照片比較多,所以在做訓練時的效果比較好,所以精準度較高
5. landmark 是什麼?
6. baseline ,我拿一張照片所猜對之機率
7. visual<visual+時間....
8. human 分類約68%,這是指不給予任何文字描述情形下,只有圖片特徵
若再加上tag就可以到 76%
9. 所下的視覺特徵的越大(vocabulary sizes ?視覺特徵所用的形容詞),其準確度越高
10. 先用 mean shift,將照片做分群,在取照片的視覺特徵
11. 表格,分類越多,準確率越低;使用越多vocabulary sizes,準確率會提升,但是全部卻比visual的方式更差,有問題
12. 總結,文字加圖片特徵比人高??
卡資 : (論文報告)
1. introduction 有點像相關研究
2. 還要重牌一下投影片順序
3. 題目似乎有點大,(集中式路況導航),作系統+路徑規畫?要著重在哪,或是全都作?
4. 把投影片拆開,改成動機 目的的方式
5. 前面介紹沒對路徑規畫沒講很多
6. 如何收集資料
widelab | 29 八月, 2010 13:13
孟澤
1 偵測和分析JAVASCRIPT的惡意程式
2 特徵:
一直重新導到不同的網址 (紀錄次數和URL)
JAVASCRIPT通常會用到混淆技巧(函數使用的次數,紀錄函數的長度)
並沒有把動態語法真正執行出來,再來判斷是否為惡意程式)
根據記憶體漏洞攻擊
攻擊目標大部分為瀏覽器的擴充元件(追蹤擴充元件的個數)
利用變數OVERFLOW的方式,將原本的CODE覆蓋掉,再用跳躍的函式,跳到想要執行的地方
3 擴充元件之記憶體,不安全的API,瀏覽器之記憶體
4 貝式分類
大學部四年級
1 台灣地圖太大,點到換顏色
widelab | 06 五月, 2010 11:48
劉彥廷:
一:Middleware - Server與Server之間的中介層
二: Virtual World: 靜態-不會改變狀態的NPC
動態-玩家
三:C++指令中 有buffer功能的指令 - f開頭的都有
四:在網路層有RTF System幫你搞定 就不需要再去管理網路層需要做些什麼事
五:Delta Update:只需要Update有差別的地方
六:三種處理地圖的方式:Zone Server 將地圖切割成很多塊 依照開發者的方式切 static的
Instance Server 將一小區塊複製到其他Server 每台Server都有相同區塊(使用率較高的)
Replication Server - So-call active entities
- Shadow entities (Read access)
七:跨區域的方式: 區塊 - 區塊(同一張地圖)
區塊 - 點(傳送點)
雙向
*小P:希望論文方向注重於切割地圖的方式 朝動態切割的方向去思考 地圖走過的頻率
=============================================================
Cloud-論文進度報告:
一:將字典的字全放入記憶體內 再去做比對的動作 這樣就不需要每次比對都要再去讀取一次字典的字
二:將Total的infi放入記憶體內 這樣hash會快很多 keyvalue是total的兩倍 這樣可以降低碰撞發生
三:DF WF = 1 的直接刪掉
四:把info都寫到同一個檔裡
==============================================================================
大學部:
一:單一景點的分享方式要再深入思考
二:遊戲分享(整個行程分享)的方式也要再深入思考
三:程式碼的部分 和介面的圖的部分 需要再加快速度進行
widelab | 22 四月, 2010 02:15
卡資報Paper
一 (第九頁) 為了避免跟別人碰撞
二 (第十一頁) 先走點還是走線
三 為何要把障礙物拿掉,有何好處,涵義;如果起始點在障礙物附近,先移動到頂點
四 小偷偷水果遊戲,會不會造成農夫全部聚集在一起
五 城市遊戲,會不會造成碰撞,當從兩台車中間穿過時,如果不會,又是如何避免
六 此篇有點沒有關聯
=======================================================
大學部
一 把GOOGLE MAP 套用上來
二 是否能不能用中華電信的MAP
=======================================================
皓塵
一 某些機器有問題,都不會動,有五台抓資料
二 看看抓幾個PAGE
三 rgz如何打開,找老師要函式
四 找HTML的如何把內容PASS出來(趴SER)
五 WGET太慢,抓圖程式另外寫 六 先抓一些圖試試看,測試準不準 七 寫成LIB,或寫成函式 八 程式裡面盡量模組化 九 如何在LINUX下如何產生LIB 十 曝光時間,ISO,光圈,曝光,閃光是否有打開...等資訊留下來 ============================================ 一 下禮拜換劉彥霆和蕭學長報告 二 下禮拜RFID投影片要上傳 三 英文PAPER要趕快寫| « | 五月 2012 | » | ||||
|---|---|---|---|---|---|---|
| 一 | 二 | 三 | 四 | 五 | 六 | 日 |
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 | |||