Notebooks
Canner 中的筆記本提供資料分析工程師操作工作區內的資料集(Datasets)以及 SQL,你可以在筆記本中使用 Python
或是 Markdown
作為撰寫的語言。
Canner Jupyter Notebook 限制
- Jupyter Notebook 的執行環境在資源配置上,為固定一台 Jupyter Server,記憶體跟 CPU 上限不會隨著用量做 auto scaling,為部屬時固定分配
- Jupyter Notebook 的執行環境為 Python 3,僅提供下列 Library 供使用,這些 Library 彼此間都有相依性,Canner 上 Jupyter Server 使用的 Library 都已測試過,確認版本間不會衝突
- 參考官網文件 → [有哪些已安裝的 Python library 可以使用?](/product/workspaces/nb/nb#有哪些已安裝的 Python library 可以使用?)
- Jupyter Notebook 執行環境為單一 Kernel,亦即所有 workspace / notebook 共享運算資源,無法獨立做資源分割 (isolation)
建議:使用外部的 Jupyter Notebook 做大量運算
建議使用自行架設或是本地端的 Jupyter Notebook 做複雜且大量的運算。Canner 所內建的 Jupyter Notebook 建議使用在簡易的確認輸出資料的正確性與驗證。
您點擊 Workspace 中的 Notebook 會出現以下畫面
以下為介紹影片:
有哪些已安裝的 Python library 可以使用?
pandas, numexpr, matplotlib, scipy, seaborn, scikit-learn, scikit-image, sympy, cython, patsy, statsmodel, cloudpickle, dill, numba, bokeh, sqlalchemy, hdf5, vincent, beautifulsoup, protobuf, xlrd, ipywidgets, facets
如何將筆記本輸出?
現在僅提供將筆記本輸出為 PDF 格式,你可以點擊選單列的 File > Export PDF
,瀏覽器便會自動下載筆記本的 PDF。
如何對工作區的資料進行操作?
每個筆記本會初始化一個 CannerClient 的實例 client
協助你取得工作區的資料。詳細的 API 操作請參閱 Python SDK。