中国虚拟天文台2005年会讨论情况记录
重要观点与建议:
虚拟天文台是一个大的科学工程。国内现在的研发状况看起来没有良好的规划,应该将其作为一个科学工程去设计和实施。
交叉认证是科学问题,仅通过位置上的信息进行证认是不够的,还要从物理性质上去考虑需要和天文学家紧密合作。交叉证认的结果分类需要进一步细化、实用化、人性化,加入误差分析。进一步了解天文背景和相关仪器的特性。
VO的成果需要及时发布,让大家去用,扩大影响,征求反馈。建议在天文学家中成立一个用户组,建立一个测试团队,及时反馈VO各种服务的使用情况。
China-VO平台非常重要,需要尽快完善稳定下来。这是以后工作顺利开展的基础。
建议以后VO的科学范例要用天文结果显著、风险小的课题,保证能出结果。比如已经发表的成果,甚至教科书中的经典课题。
为天文常用软件提供命令行方式的VO服务访问接口,在不改变天文学家工作习惯的前提下使用VO,是很多天文学家乐于接受的。
建议把现有的各种VO资源服务分好类整理在China-VO网站上,提供出来,为用户提供导航服务,中英文双语版最好。
建议有专人协调一下,将全国的相关工作包含进来。不但是国台内部的,还需要更广泛的合作把其他接近VO的工作都包括进来。这样可以避免重复劳动,也避免将来整合时的困难。
经常性的回头看是必要的,各种想法、开发工作不能偏离VO的总体架构和良好的初衷。
发言人:
邓李才(邓)
赵永恒(赵)
姜碧沩(姜)
黄文宏(黄)
崔辰州(崔)
张彦霞(张)
杨雁宾(杨)
曹 晨(曹)
何金华(何)
胡邵明(胡)
于 策(于)
罗 泽(罗)
孙华平(孙)
田海俊(田)
发言记录:
邓:虚拟天文台是一个大的科学工程。我们的研发看起来有点乱,应该将其作为一个科学工程去设计和实施。
邓:交叉认证是科学问题。为什么做交叉认证?这是一个可能有发现的一件事情。应该作为一个研究题目提出来。仅通过位置上的信息进行证认是不够的,还要从物理性质上去考虑。仅仅从数学上很难照顾到物理上的问题。除了在星表级别上以外,还可以从图象上再加工以得到更好的结果。天文学家和计算机人员需要紧密合作。
曹:图像的交叉证认有很多人在专门做,作为虚拟天文台的一项工作可能很难,这是一个长期的艰巨工作。如果从图像从头再来的话工作量太大了。复杂的专业化的图像处理不是单纯VO人员能做的。很多是作仪器的人专门做的。据我所知国际上计算机专家与天文学家的配合也不是很好。
张:IVOA的工作组和兴趣组就是天文学家和VO开发人员合作的平台。多方专家需要互相反馈不断更新才能做出用户满意的产品出来
孙:如果感觉China-VO乱,那么US-VO就更乱。VO是一个胃口超大的系统。我们需要为不同的人提供不同的产品,各个产品是相互补充的。服务多了,VO也就充实起来了。美国虚拟天文台也提供了很多不相干的服务。大家都是一层一层做起。
邓:你可以在一个部分的基础之上再作,而不是要重复开发
黄:可以先搭起一个系统,再慢慢丰富。另外,我觉得有些数据计算量大的话,可以缓存下来,下次再用的时候就快了。二次数据的充分利用很重要。
邓:从政治上讲,资金不可能分散。如果投资的话只能投给一个项目。一个平台是需要的,不要搞几个平台。
赵:关于体系结构,VO一定要做出一个平台来,以后都在这个平台上再开发。我以前讲VO应该是一棵树,树根是一个,用户做树叶。平台负责如何从树根到树叶的联系。开发只是从树叶做起。树根树叶越来越壮才好。不是每个人单独搞一个平台。平台建设是近期急需的事情。邓讲的是树叶的问题,天文学家提出需求。你做的要看是不是符合天文学家的需求,我们从这需求里面选择一些合适的,用这个需求把树根树干做好。有了平台之后剩下的就是简单扩张,与天文学家结合开发出适合天文学家需要的东西。
邓:报告中展示的成果都已经是半成品了,要及时发布出来,让大家去用,扩大影响,征求反馈。可以发布到公告栏上也可以参加团组的讨论,不定期举行VO发布会。
何:我建议在天文学家中建立一个测试团队,及时反馈使用情况。
赵:等原型系统能够发布出去以后就可以测试,用户多了会越测越好。
杨:找一些合作的课题,让天文学家做一些测试,体验VO的特色,一个课题下来就有技术成熟了。
赵:杨雁宾那边有什么可以提出来一起合作
邓:VO的特色提现在海量数据和多波段上,有些是技术问题,有些是科学问题。
黄:赶紧把平台定下来非常重要
赵:等原型II实现后平台就可以基本定下来了
何:VO的开发不仅是发展软件,还要保证正确性,结果的正确性,为软件提供测试保证。
黄:把数据格式化、标准化很重要。
姜:去年年会觉得你们工作做得很好,原因就是对课题的天文学背景熟悉。今年感觉没有振奋的天文结果,原因是和天文学家的结合不够
邓:我觉得还是有进展,至少刘超那个工作。只是先天不足,导致结果不好,不可验证。建议以后的科学范例要用天文结果显著的课题,保证工作能出结果。
姜:交叉证认要做得好必须了解天文背景和仪器的特征,才可能把结果做得令人信服。
邓:交叉证认的结果分类需要进一步细化、实用化、人性化,加入误差分析。高丹工作的问题:一对无应该是最常见的一个现象,而不应该是稀有现象。一对多的情况可能是分辨率不匹配。怎样从技术上考虑,给一个附加结果的信息?
姜:今年的Prototype I比较困难,是不是可以考虑用VO做一个教育的案例,只是说给学生讲课的时候用。这是没有风险的,一下就可以做出来结果。
赵:华中师大瞄准的是非天文专业的教育。如何使用真实的数据和真实的软件做天文。比如SETI是一个例子,还有快速移动天体,还有SOHO彗星。有软件告诉怎么做就可能有科学发现。我们将目前的软件加工,给非天文专业的人。北师大想用来做专业教育,希望你们多想些方案。我们有这么多巡天数据,可以重新整合成教学或实践用的材料。您们师大了解教学方面该怎么做,可以提出来,我们一起去实现。
杨:教学可以拿已经发过文章的东西,再重复一遍,看看在VO下有没有区别。
姜:天文学导论已经是国家级精品课程,加上VO就更好了。比如说恒星的光谱序列。
赵:做类星体的光谱模板。希望大家提Idea,这样才有技术动力。我们希望VO别人拿回去自己开发。现在希望能用就行。希望先做叶子,一点一点积累。首先找一些例子,做一个课题产生一组工具,越做越多。天文学界才会觉得越来越好用。
杨:天文学常用软件,比如IRAF等,都是命令行下的单机版,如果能有网络化的话会更好。
赵:这个叫做封装,一旦封装就可以在网络上任何地方使用。VO有人在做这方面的工作。
杨:我的意思是工具在用户端,比如为IRAF提供VO接口,通过IRAF去访问VO服务。这个方式能方便天文学家使用又不改变现有的工作方式,很实用。
赵:就像刚才讲的屏幕取词的例子,不管数据从哪来,一个命令就可以得到数据了。
胡: 一个问题,不知道VO有没有云南台和上海台的数据?
赵:地面望远镜的数据归档以前做得不好。特别是国内没有人去整合。比较好的是BATC,但是2.16就不行。即便拿到数据也因为缺信息而不能用。新的望远镜这方面应该做得很好了。目前国内数据整合比较困难,有技术的,有人为的,有科学的因素。
何:各VO将来必定会整合为IVO,不同国家的VO怎么融合?
赵:这正是IVOA的任务,IVOA有互操作会议定义统一接口。
何:我建议把现有的各种VO资源服务分好类整理在China-VO网站上,提供出来,为用户提供导航服务,中英文双语版最好。
赵:需要提供一个门户网站,需要什么都可以找到。最初做数据文献,将来扩大到其它方面,整合起来。
崔:明年年会的时候China-VO会改版,会有现有工具的列表和说明
赵:这个网站是一个接口,主要是把国外的资源提供给国内用户。
何:是不是有专人协调一下,将全国的相关工作包含进来?不但是国台内部的,还需要更广泛的合作把其他接近VO的工作都包括进来。
赵:这是需要的,这样可以避免重复劳动,也避免将来整合时的困难。只要大家有兴趣,我们都是欢迎的。我们可以一起合作开发。
于:是不是就VO这个项目做一个论坛,大家分布在各地,如果有一个论坛可能解决问题会快一些。
孙:我们yahoo上有一个Email group
田:我的小网站上有论坛,但是没有宣传。
崔:其实yahoo上的group很好用。BBS大家可能不会去看,但是mail大家就会看。
于:现在有一个趋势:在网上建立虚拟空间,无论在哪里都可以使用,有现成的软件。包括团队管理、文档管理。
杨:主要不是在文档上,主要是在程序上协调。
于:辰州的论文对VO有非常清楚的描述,建议大家都去看看。所有的人都可以提出意见,但不要偏离总体的体系。我觉得VO阶段性目标不明确。不知道VO的数据将发布到哪个层次上?实现数据网格并不复杂,可以先实现出来,应该很成熟了。
赵:三步走:第一阶段是数据访问。第一步发布国内外的数据,通过简单的方式;第二步:按照VO的国际标准做成服务,都可以用;第二阶段:瞄准常见的工具;第三阶段:将简单的工具组合,面对海量数据大规模计算,让它变得很强大。现在面对的是第一步和第二步。第一步差不多了,但还有工作要做。希望第二范例开发以后平台稳定下来,其他人就可以在上面开发了。简单安装上以后,按照规范发布数据或开发软件(子结点)。物理上是分布的、逻辑上是一致的。厉害的人希望用WS这样的接口,象库一样调用。现在平台还没有做出来。我估计原型II做好后大致上就是可用的了。大家就可以添砖加瓦。
于:为什么没有关注并行计算
赵:现在还没有到那个阶段。交叉证认已经涉及到这个问题,希望用网格结点来为我们的程序计算。需要迁移到超算中心。
崔:我把USNO的10亿数据260G数据灌到Mysql中,一行一行输入,一个星期没有做完,能不能并行?
罗:不是计算问题,是IO问题。
于:计算量不大,操作系统是瓶颈。
赵:于,我们如何将数据、程序迁移到你们那里运行?
罗:我的了解现在还没有达到这种程序、算法迁移的程度,还不能动态迁移。
刘:计算迁移问题是很复杂的,需要和目的方的软硬件结合。
杨:为了超算中心专门设计一套程序放在那边。
赵:数据中心应该同时是计算中心。于,你关心迁移。我有两个问题,能不能迁移?效率是不是好?
罗:我们很乐意提供计算等资源,对我们也是有展示度的工作。这是双发的共同需求。我认为前面提到的要把VO的开发和真正的科研结合起来,这个是很重要的,可以提现出VO的价值。搞计算机的非常需要应用来支持。这有利于双方的合作,推动VO的发展。
何:营利性的组织也可以合作
赵:我们的数据是免费的,非常希望那些能用我们的数据开发产品的客户,比如和tom.com合作。VO是全开放的,欢迎所有人合作。
赵:海量数据将来肯定会在罗泽那边备份、处理。于策那边把计算迁移过去。海量数据必然是大规模计算,这是真正体现VO的科学价值。罗泽那边也应该想一想,怎样衔接起来。
崔:LAMOST也可以像SDSS那样,在罗泽那边有完整备份,甚至数据分析也有备份。
杨:BATC的数据在CNIC有备份吗?
赵:911以后要求异地备份。BATC做好以后也迁移到网络中心上面去。
6:10 China-VO 2005 胜利闭幕
记录整理:刘超、崔辰州